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ABSTRACT 



This study presents an empirical investigation of basic 
processes in the perception of speech sounds. The experimental methods 
applied have their roots in two different psycholinguistic research 
paradigms; i.e., "categorical perception" and "dichotic listening." In the 
categorical perception paradigm, listeners' categorization of speech sounds 
is compared with their ability to discriminate speech-like stimuli forming a 
physical continuum (suclx as the range between a T-sound and a D-sound) . In 
the dichotic listening paradigm, differences in listeners' identification of 
speech stimuli presented to either left or right ear are interpreted as the 
result of hemispheric lateralization. Extensive results include the 
following: (1) the acoustic consonant -continuum revealed a high degree of 

categorical effect; (2) when the same acoustic continuum was presented in the 
dichotic listening experiment, subjects showed a markedly better ability to 
identify stimuli presented to the right ear than stimuli presented to the 
left ear; (3) on the other hand, the acoustic vowel -continuum revealed no 
categorical effect at all; and (4) similarly, no general dichotic effect was 
found when the same vowel -continuum was presented in the dichotic listening 
experiment. Findings suggest that there exists a clear connection between the 
categorical and the dichotic effect. (Contains 211 references and 51 figures 
of data. An appendix contains acoustic analyses of synthetic vowel-continua. ) 
(SR) 
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Forord 



Naervaerende Odense Working Papers in Language and Communication er i 
store track identisk med specialeafhandlingen Kontinuitet og diskontinuitet. En 
eksperimentalfonetisk unders0gelse of lateraliserede perceptionsprocesser, 
som jeg indleverede ved SDU-Odense Universitet i efter^et 1998. 

Raekken af fors0g, der er beskrevet i Sproglyde: fysiske kontinua og mentale 
kategorier, blev alle udf0rt i l0bet af forars- og sommermanedeme 1998. Jeg 
er taknemmelig over for de mange personer, der - mere eller mindre 
frivilligt - bar deltaget i fors0gene, samt IT-funktionen, Humaniora, der 
stillede teknisk udstyr og ekspertise til radighed. 

Kirsten Gregersen fra davaerende Center for Anvendt Lingvistik og 
Fremmedsprogspaedagogik - var min vejleder i forbindelse med speciale- 
afhandlingen, og jeg skylder hende tak for stort engagement, utallige laererige 
kommentarer og nyttige rad. 

I forbindelse med udarbejdelsen af Sproglyde: fysiske kontinua og mentale 
kategorier er jeg professor Hans Basb0ll meget taknemmelig for mange 
stilistiske og indholdsmaessige kommentarer, der har forbedret manusskriptet' 
betydeligt. 

Endelig skal der lyde en tak til Institut for Sprog og Kommunikation for at 
give mig mulighed for at fa Sproglyde: fysiske kontinua og mentale 
kategorier udgivet. 



Resume 



Formalet med naervaerende studium er at foretage en empirisk funderet unders0gelse af 
grundlaeggende processor i perceptionen af sproglyde. De anvendte fors0gsmetoder tager 
udgangspunkt i de eksperimentalfonetiske/psykolingvistiske paradigmer Ikategorisk 
perception* og 'dikotisk Ivtning' . 

Et typisk fors0g med kategorisk perception best^ af to dele: en identifikations0velse og en 
diskriminations0velse, I identifikations0velsen skal fors0gspersoneme identificere de 
praesenterede stimuli, hvorimod de i diskriminations0velsen skal fors0ge at skelne mellem 
stimuli, der praesenteres i par. De praesenterede stimuli udg0r almindeligvis et akustisk 
kontinuum med varierende VOT (voice onset time) eller formantfrekvenser. Hensigten med 
fors0get er at afsl0re fors0gspersonemes evne til at skelne mellem akustisk lige forskellige 
stimuli, som de bar tilskrevet hhv, samme og forskellige sproglige kategorier. Hvis de 
grundlaeggende processor i perceptionen af sproglyde var baseret p& akustisk information, 
kunne man forvente, at fors0gspersoneme skelnede lige godt mellem stimuli, de havde 
tilskrevet hhv. samme og forskellige kategorier. Imidlertid viser fors0g med praesentation af 
klusiler, at det er markant svaerere at skelne mellem stimuli, der kategoriseres ens, end stimuli, 
der kategoriseres forskelligt. Dette faenomen betegnes almindeligvis *den kategoriske effekt* 
og fortolkes som resultat af fonetisk perception baseret pS diskrete artikulatoriske 
kommandoer. Det er dog ikke alle sproglyde, der fremkalder en (lige stor) kategorisk effekt. 
Gennem de sidste 45 ar har en lang raekke fors0g med kategorisk perception vist, at lukkelyde 
fremkalder den kraftigste kategoriske effekt, nasaler, lateraler og frikativer en mindre 
kategorisk effekt, og at vokaler perciperes kontinuerligt. 

I et andet forskningsparadigme, dikotisk lytning, har man ligeledes kunnet konstatere en 
markant forskel mellem perception af klusiler, perception af lateraler og frikativer, og 
perception af vokaler. I fors0g med dikotisk lytning, dvs. dobbeltsidig h0replvirkning, 
praesenteres fors0gspersoneme simultant for to stimuli - 6n i hvert 0re - hvorefter de skal 
identificere 6n af de pagaeldende lyde. Umiddelbart skulle man forvente, at fors0gspersoneme 
identificerede fokuslydene lige ofte, uanset om de blev praesenteret for h0jre eller venstre 0re. 
Imidlertid viser de fleste fors0g med dikotisk praesentation af klusiler en praeference for h0jre 
Ore , dvs, en signifikant bedre identifikation af stimuli praesenteret for h0jre 0re end af stimuli 
praesenteret for venstre 0re. Dette faenomen betegnes *den dikotiske effekt' og fortolkes 
almindeligvis som udtryk for hemisfaereasvmmetri . nemlig venstre hjemehalvdels dominans 
for sprog. Heller ikke i fors0g med dikotisk lytning fremkalder alle sproglyde en lige stor 
effekt. Resultateme af de fleste fors0g er, at klusiler fremkalder den st0rste dikotiske effekt. 
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lateraler og frikativer en mindre dikotisk effekt, og at vokaler ikke fremkalder nogen dikotisk 
effekt. 

I begge eksperimentalfonetiske/psykolingvistiske paradigmer arbejdes der ud fra en hypotese 
om, at perceptionen af sprog involverer et saerligt sprogmodul, en sSkaldt sproeprocessor . der 
varetager analysen af aitikulatorisk komplekse sproglvde . I den ene forskningstradition under- 
bygges hypotesen af forsdg, der viser, at klusiler perciperes som diskrete st0rrelser og vokjiler 
mere kontinuerligt. I den anden forskningstradition anses hypotesen for at vaere den eneste 
plausible forklaring pS, at fors0g med dikotisk lytning afsl0rer en henaisfaereasymmetri ved 
prassentation af klusiler, men ikke ved vokallyde. I begge forskningsparadigmer har man dog 
hidtil kun gjort sig teoretiske overvejelser om en eventuel sammenhaeng mellem den 
kategoriske og den dikotiske effekt. 

For at fastsli om der eksisterer en sammenhaeng mellem den kategoriske og den dikotiske 
effekt, udarbejdede jeg et VOT-kontinuum og et formantkontinuum, der skulle udg0re hhv. 
konsonant- og vokalstimuli i to forskellige fors0g, et med kategorisk perception og et andet 
med dikotisk lytning. Til fors0gene udviklede jeg et computerprogram, DikoTest 3.0, specielt 
konstnieret til kontrolleret praesentation af stimuli og registrering af fors0gspersonemes 
respons. Gruppen af fors0gspersoner, der blev anvendt i begge fors0g, bestod af 57 personer 
fordelt pS 41 danskere (28 kvinder og 13 maend) og 16 fmner (14 kvinder og 2 maend) i 
alderen 12-61 ar. 

I fors0get med kategorisk perception afsl0rede det akustiske konsonantkontinuum en h0j grad 
af kategorisk effekt: I identifikationsfors0get inddelte fors0gspersoneme det akustiske 
kontinuum i skarpt afgraensede kategorier; i diskriminationsfors0get havde fors0gspersoneme 
meget svaert ved at skelne mellem stimuli, som de selv havde tilskrevet samme kategori, 
hvorimod de meget lettere kunne skelne mellem stimuli fra forskellige kategorier. I>a samme 
akustiske kontinuum blev praesenteret i fors0get med dikotisk lytning, viste fors0gspersoneme 
en markant bedre evne til at identificere stimuli praesenteret for h0jre 0re end stimuh 
praesenteret for venstre 0re. Omvendt fremkaldte det akustiske vokalkontinuum slet ingen 
kategorisk effekt: Fors0gspersoneme var i stand til relativt konsekvent at tilskrive stimuli de 
samme kategorier, og i diskriminations0velsen gjorde det ingen forskel for fors0gs- 
personeme, om de skulle skelne mellem stimuli fra samme eller forskellige kategorier 
- udfaldet var lige ringe. Ligeledes fandt jeg heller ikke nogen generel dikotisk effekt, da jeg 
praesenterede det samme vokalkontinuum i fors0get med dikotisk lytning: fors0gspersoneme 
var generelt ikke bedre til at identificere stimuh praesenteret for h0jre 0re end stimuh 
praesenteret for venstre 0re. 
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Da flere fors0g har vist en tendens til en mindre markant kategorisk og dikotisk effekt ved 
praesentation af bl.a. lateraler og frikativer, valgte jeg endvidere at inddrage CV-stavelseme 
[la], [ma], [na], [fa] og [va]. Disse stimuli blev praesenteret i forsdget med dikotisk lytning og 
afsl0rede - som forventet - en dikotisk effekt, dog mindre end den jeg fandt ved praesentation 
af det akustiske VOT-kontinuum. PI baggrund af resultateme fra omtalte fors0g kan jeg 
konkludere, at der eksisterer en klar sammenhaeng mellem den kategoriske og den dikotiske 
effekt. 

Hensigten med at inddrage en gruppe finske fors0gspersoner i unders0gelsen var at finde ud 
af, om fors0gspersoner, der taler forskellige modersmil, kategoriserer de samme akustiske 
kontinua ens eller forskelligt. Hvis den kategoriske effekt skyldes sproglydenes akustiske 
struktur, skulle man forvente, at den determinerer de fonetiske kategorier - dvs. 
identifikations- og diskriminationsgraenseme - uafhaengigt af den lingvistiske organisering af 
fors0gspersonens modersmil. Hvis den kategoriske effekt derimod skyldes sprogspecifikke 
artikulatoriske strukturer, ml den forventes at forekomme ved alle lingvistiske kategorigraenser 
- og kun der. Sp0rgsmllet om hvorvidt den kategoriske effekt skyldes psykoakustiske 
faktorer eller sprogspecifikke fonetiske kategoriseringer kan ikke besvares belt ^ntydigt pi 
baggrund af fors0gsresultateme. Det fremgir dog meget tydeligt, at den lingvistiske 
organisering af fors0gspersonemes modersmil har en stor indflydelse pi identifikationen og 
diskriminationen af sproglyde fra akustiske kontinua; de to grupper af fors0gspersoner 
strukturerer de akustiske kontinua forskelligt, men belt i overensstemmelse med de fonetiske 
kontraster i de respektive sprog. Omvendt viser dele af resultateme, at sprogspecifikke 
artikulatoriske strukturer ikke kan forklare alle faenomener, men at sprogbrugere ogsl 
anvender anden information end de artikulatoriske kommandoer i identifikationen af 
sproglyde. 
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Tegnsysiem, kode og medium 



1.1 Tegnsystem, kode og medium 

Den sproglige kommunikation er en formalsbestemt aktivitet; den er ikke bare 
lyde eller streger pa papir, men ogsa en systematisk organiseret aktivitet 
motiveret af en intention om at overf0re et budskab\ Som sadan kan den 
sproglige kommunikation betragtes ud fra en generel teori om tegn, 
semiotikken^ der vedr0rer studiet af alle aspekter af tegnsystemer til brug for 
kommunikation. 

If0lge strukturalismen, som den er defineret hos bl.a. Saussure og senere 
Hjelmslev, er en vaesentlig forskel mellem sprogsystemet og andre tegn- 
systemer, at det sproglige (mindste-)tegn er karakteriseret ved et arbitraert 
forhold mellem udtryk og indhold^ Udtryk og indhold betegnes i Saussures 
terminologi ’signifi^’ og 'signifiant', der svarer til en begrebslig st0rrelse og en 
akustisk (eller anden fysisk) st0rrelse: 

"The linguistic sign unites, not a thing and a name, but a concept and a sound-image" (Bally 
& Sechehaye (ed.) 1959:16). 

Distinktionen mellem tegnets udtryksside og indholdsside vedr0rer ikke 
distinktionen mellem form og substans. Saussure antog, at der er to substanser 
(1yd og betydning) og ^n form (Bally & Sechehaye (ed.) 1959). Hos Hjelmslev 
opdeler denne form den ellers amorfe 1yd- og betydningsmasse (der hos 
Hjelmslev betegnes ’mening’, Omkring Sprogteoriens Grundlaeggelse 1943, 
herefter forkortet ’OSG') og sa at sige former udtrykssubstansen og indholds- 



‘ Dette betyder naturligvis ikke, at den sproglige kommunikation udelukkende er af en 
propositionel og/eller intentionel karakter. If0lge Roman Jakobson har den sproglige 
kommunikation en raekke funktioner (den emotive, fatiske, poetiske, referentielle, 
metalingvistiske og den konative funktion), der hver relaterer sig til de konstituerende 
faktorer (afsender, budskab, kontekst, kontakt, kode og modtager). 

^ Begrebet 'semiotik' (af graesk *techn6 s6mei6tik6') anvendtes si vidt vides f0rst i antikkens 
Graekenland af medicinske teoretikere om sygdomssymptomer og -diagnosticering (Morris 
1946). De stoiske filosoffer er herefter begyndt at anvende begrebet som reference til en 
generel tegnteori. I slutningen af det 19. Irhundrede producerede den amerikanske 
pragmatiske filosof Charles Sanders Peirce en raekke skrifter, hvor han definerer semiotik 
som "the formal doctrine of signs... a sign is something which stands to somebody for 
something in some respect or capacity" (Hartshorne & Weiss 1931-35: 227-8). Den 
strukturelle lingvistiks fader, Ferdinand de Saussure, beskriver i begyndelsen af det 20. 
Irhundrede semiotikken som en videnskab om tegnenes liv i samfundet og dermed 
overordnet lingvistikken: "Linguistics is only a part of the general science of semiology" 
(Bally & Sechehaye (ed.) 1959:16). 

^ Jeg ser her bort ffa de fl, men ofte omtalte onomatopoietika - de bliver alligevel oftest en 
del af de arbitraere tegn efter nogen tid (jf. eng. 'pigeon' fra lat. 'pipi6'). 
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substansen. Hjelmslev pointerede dog i OSG, at heller ikke udtrykssidens form 
og indholdssidens form er to konforme (ligedannede) plan og at de derfor ma 
beskrives hver for sig. Saledes definerer strukturalister sprogvidenskaben som 
en formel videnskab om 'sprogform', hvor genstandsfeltet, sprog, essentielt er 
et system af former, ikke substans, hvor tegnets afgraensning, dvs. dets relation 
til andre tegn, konstituerer form. Hvor form udg0r en repraesentation for en 
lingvistisk enhed, vedr0rer substans det medium, som den lingvistiske enhed 
manifesteres i. Manifestationen er altsa en funktion mellem form og substans. 

Den tidlige strukturalisme, repraesenteret ved Saussure, definerede 
lingvistikkens objekt som et abstrakt formsystem bestaende af tegn og tegn- 
relationer, men kun tilgaengeligt via manifestation i substans. Denne definition 
af lingvistikkens objekt er senere blevet kritiseret for at laegge for stor vaegt pa 
tegnenes relationer i systemet og at negligere den lingvistiske kode"^. 

Den lingvistiske kode; Dobbelt artikulation 

Det er et definerende karakteristikum ved sprog, at det er uafhaengigt af det 
medium, det manifesteres i (jf. forskellen mellem sprog og tale, language og 
speech, Sprache og Rede etc.), og at selve den lingvistiske kode udviser en 
dobbelt struktur. Pa den ene side har vi betydningsl0se elementer med saerlige 
regler for kombinatorik og andre ikke-semantiske egenskaber. Pa den anden 
side har vi betydningsbaerende kombinationer af de betydningsl0se elementer 
(Lass 1984). Den dobbelte artikulation vedr0rer altsi dannelsen af betydnings- 
baerende enheder, tegn, ved kombinationer af betydningsl0se elementer i et 
forl0b. 

Sprogets primaere medium er Ivd 

Sprogsystemet er grundlaeggende uafhaengigt af det medium, det manifesteres i, 
men skal man fremhaeve et medium som det primaere eller naturlige for 
menneskers sprog, er det 1yd (Lyons 1981). Jeg vil her antage det synspunkt, at 
talen er onto- og fylogenetisk primaer^. 

* P& trods af det betydningsfulde fokusskifte fra 'objekter' til 'relationer', der fandt sted i 
begyndelsen af dette arhundrede, er det uheldigt udelukkende at definere et tegns vaerdi ved 
dets opposition (eller relation) til andre tegn, dvs. ogsS til deres relationers relationers etc., 
da denne type definition rammes af en 'infmit regres'. Desuden pointerer Chomsky i 
'Aspects' (Chomsky 1965), at det ikke er tilstraekkeligt at beskrive sprogsystemet som et 
system af elementer og relationer, men at det ogs& ma udg0re et system af regler for 
elementemes kombination. 

^ Med distinktionen mellem talesprog og skriftsprog refererer jeg til det medium, hvori 
meddelelsen realiseres. Ofte anvendes distinktionen (ikke saerlig klart) om normer i tale og 
skrift, jf. udtrykket "en talesprogsnaer tekst" (Basb0ll 1977). 
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Ethvert normalt bam i enhver kultur tilegner sig et talesprog, hvorimod mange 
aldrig laerer noget skriftsprog. I de tilfaelde, hvor personer bade tilegner sig et 
tale- og et skriftsprog, g0r de det altid i naevnte raekkef0lge (Basb0ll 1977). 
Desuden forholder det sig ogsa sadan, at hvor b0m tilsyneladende ubesvaeret 
tilegner sig et talesprog, blot de udsaettes for sproglig stimulation, sa kraever det 
en god portion motivation og lang tids h^dt arbejde at tilegne sig et skriftsprog 
(Heger 1992). 

Der er sandsynligvis en sammenhaeng mellem bamets motoriske udvikling og 
sprogtilegnelsen: traeningen af taleorganerae begynder pS et tidspunkt, hvor 
bamets koordinationsevner og motorik slet ikke har naet et stadium for skriftlig 
kommunikation. Senere, nar bamet nSr skolealderen og den tid, hvor skrift- 
sproget skal tilegnes, har det allerede tilegnet sig et temmelig nuanceret 
talesprog. Skriftsproget kommer sdledes til at udg0re en overbygning pa det 
allerede tilegnede (tale-)sprog (Garman 1990). 

Alle kendte samfund har et eller flere talesprog, mens et stort antal af disse ikke 
har noget skriftsprog (jf- dialekter). Det er ofte tilfaeldet, at kulturer, der f0r var 
analfabetiske, har fSet indf0rt et skriftsprog, men ved fremmed indflydelse af 
en eller anden art. 

Endelig er det vigtigt at pointere, at mennesket er biologisk udrustet til at laere 
at tale et sprog. Hvis et bam vokser op i kontakt med andre mennesker, vil det 
almindeligvis laere at tale af sig selv, mens man kun med de allerst0rste 
anstrengelser kan laere et h0jerestSende dyr nogle fa ord^. 

Fonologiske elementer oe taleakter 

Distinktionen mellem det formelle sprogsystem og dets manifestation i 
substans g0r sig ogsa gaeldende i studiet af talen. I studiet af talens udtryksside 
et det saledes almindeligt at skelne mellem systemiske former, de fonologiske 
elementer, og deres applikation i talen, taleakten’. 

^ De mest kendte forspg pa at laere dyr sproglig kommunikation har vaeret med 
chimpanseme Vicki, Washoe, Lana, Sarah, Kanzi og Nim Chimpsky. Da opbygningen af 
chimpansemes taleorganer udelukker muligheden for verbal kommunikation, har man enten 
anvendt symboltavler eller ASL (American Sign Language). Kun i enkelte tilfaelde har man 
anvendt andre dyr, som f.eks. gorillaer og delfiner. Forspgene har hpjst haft en begraenset 
succes (Steinberg 1993). 

’ Med begrebet 'taleakt' refererer jeg ikke til den pragmatiske teori om sproghandlinger, der 
hos Austin og Searle betegnes ’Speech Acts’ (jf. ogsa Schiffrin 1994; Sperber & Wilson 
1986; Mey 1993). Taleakten betegner derimod den konkrete udpvelse af sprogbrug med lyd 
som medium. 
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Den strukturalistiske beskrivelse af forholdet mellem taleakten og de 
fonologiske elementer den antages at reprassentere, udg0r traditionelt skille- 
linjen mellem de to discipliner fonologi og fonetik. Fonologi betegnes ofte som 
studiet af former i talesprog og fonetik som studiet af substans i talesprog. Det 
vil dog, efter min mening, vasre mere korrekt at sige, at fonologi og fonetik 
begge vedr0rer form og substans i talesprog, selvom de varierer i deres 
primaere fokus. Fonologien lasgger st0rre vasgt pa former i talesprog, hvorimod 
fonetikken f0rst og fremmest vasgter talesprogets substans. Netop disse to 
discipliners afgraensning, arbejdsfordeling og indbyrdes relationer vil vaere 
emnet i det f0lgende. 

Fonologi og fonetik 

Distinktionen mellem de to discipliner fonologi og fonetik bygger traditionelt 
pa en antagelse om en ontologisk forskel mellem sprogsystem og sprogbrug. Pa 
den ene side siges fonetikken at studere den fysiske eller konkrete virkelighed, 
taleakten, ved hjaelp af naturvidenskabelige (bl.a. akustiske og anatomiske) 
teknikker. den anden side siges fonologien at studere den lingvistiske 
organisering af formelle distinktioner i et konkret sprog. 

Hvad der umiddelbart lader til at vasre en rimelig arbejdsfordeling mellem 
fonologer og fonetikere aff0der ofte diskussioner om talens "egentlige" natur. I 
lyset af forskellige syn p^ talens ontologi vasgtes omrademe mod hinanden og 
grasnseme traskkes hardt op. En konstatering af, at fonetikken fokuserer pa 
talens universelle fysiske egenskaber, kan alt for let opfattes som en pistand 
om, at fonetikken vedr0rer en obiektiv fysisk eller konkret virkelighed studeret 
ved hjaslp af videnskabelige metoder, mens fonologien blot fors0ger at beskrive 
en lingvistisk strukturering af denne virkelighed. Omvendt kan samme 
argument anvendes som grundlag for en pastand om, at fonologien vedr0rer 
talens egentlige mentale realitet, hvor fonetikken blot beskriver en fysisk 
manifestation af denne realitet. 

Ovenstaende oversimplificerede distinktion mellem fonologi og fonetik er en af 
de vaesentligste arsager til, at relationen mellem disciplinerne let bliver 
kontroversiel. Effekten er, at grundlaeggende definitioner inden for begge 
omrader fokuserer pa adskillelse af disciplinerne, og ikke integration af viden. 

Det er vigtigt at pointere, at talens universelle karakteristika ikke udelukkende 
er fonetikkens ejendom, ligesom de sprogspecifikke strukturer ikke alene er 
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fonologiens. Selvom fonetikere ofte griber til generaliseringer om taleorganer 
og om auditive og akustiske forhold, er interessen for generaliseringer og 
kategoriseringer af sprog sjaeldent mindre hos fonologer. Enhver bestraebelse 
pa at anvende systematiserede begrebssystemer eller notationssystemer (som 
f.eks. det udbredte IPA-system) i beskrivelsen af forskellige sprog prae- 
supponerer en interesse for universalitet. Omvendt fokuserer en relativt stor del 
af de fonetiske unders0gelser pa sprogspecifikke forhold, f.eks. de danske 
vokaler®. Det vil altsa heller ikke vaere rimeligt at sige, at interessen for 
universalitet er et definerende karakteristikum for fonetikken, men ikke for 
fonologien. 

Beskrivelsen af den fonetiske analyse som behandling af objektive fysiske eller 
konkrete forhold er heller ikke entydig. Der er dog ingen tvivl om, at 
fonetikken i h0jere grad end fonologien anvender kvantitative metoder; f.eks. 
er det muligt at r0ntgenfotografere taleorganeme under udtalen af en vokallyd, 
og male muskelaktiviteten samt indlaese de akustiske data i et spektrogram ved 
hjaelp af en spektrograf eller computer. Men disse kvantitative st0rrelser er 
meget lidt informative, hvis ikke de kan relateres til sprogbrugerens 
lingvistiske system. Selv hvis vi er i stand til at redeg0re for alle kvantitative 
forhold, vil vi ikke dermed have afdaekket det essentielle ved talen - den er per 
definition mere og andet end de fysiske forhold. 

Omvendt er der ogs^ en fare forbundet med en ensidig fokusering pa det 
lingvistiske system; man kan let forledes til at antage, at lingvisten er fri til 
spekulation om sprogbrugerens mentale organisering af det lingvistiske system. 
Det er derfor vigtigt, efter min mening, at videnskabelige unders0gelser af 
sprog - isaer sprogsystemers mentale realitet - er empirisk funderet, dvs. er 
baseret pa observationer. Med andre ord skal postulater om den mentale 
organisering af lingvistiske systemer kunne relateres til observerbare 
faenomener, ligesom kvantitative st0rrelser (f.eks. artikulatoriske eller 
akustiske) skal kunne relateres til sprogbrugerens lingvistiske system. 



® Jf. f.eks. Fr0kjaer-Jensen 1966 og Petersen 1976. 
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1.2 Akustisk segmentering og invariante track 

Nogle af de mest centrale sp0rgsmal i udforskningen af den menneskelige 
sprogperception er: Hvordan perciperes og fortolkes ytringen pa baggrund af 
taleaktens akustiske signal? Hvilke mekanismer og processor indvirker pa 
perceptionen? 

Umiddelbart oplever vi talen som bestaende af en serie af diskrete, ikke- 
overlappende og relativt konstante elementer. Indtil op i 1960'eme var det da 
ogsa en udbredt antagelse, at man pa et tidspunkt - med det rette tekniske 
udstyr - ville vaere i stand til at isolere de distinktive elementer, som var de 
perler pa en snor. Man havde store forventninger om at kunne afdaekke en ^n- 
til-en korrespondens mellem det akustiske signal og de fonetiske segmenter^ 

I nogle fors0g baseret pa antagelsen om akustisk segmentering optog man en 
raekke tydeligt udtalte (engelske) ord: 'pet', 'bat', 'cat' og 'hat' - tydeligt 
udtalt for at f^ segmentemes fulde omfang. Derefter ville fors0gsledeme 
isolere [p], [b], [k], [h], [e], [ae] og [t] pa magnetbdnd. Nu skulle det sa i teorien 
vaere muligt at kombinere segmenteme i nye m0nstre for at konstruere nye 
ord som f.eks. 'bet' og 'pat' (Peterson et al. 1958). 

Fors0genes resultat bestod udelukkende i en erkendelse af, at det ikke er 
muligt at isolere fysiske entiteter i talen, der aekvivalerer med fonemer - selv 
ikke med avanceret teknisk udstyr. De lydlige elementer, der udg0r talen, 
glider over i hinanden og er integreret i hinanden, sa det med fa undtagelser 
er meget svaert at fastsli, hvor ^t segment begynder og et andet slutter 
(Springer 1979). 

Da talen i dens akustiske medium er flygtig og uhandgribelig, kan det vaere en 
stor fordel at anvende en spektrograf, der kan give et visuelt billede af lyden i 
et frekvens-intensitet-tid-diagram. Figur 1.2.1 er et spektrogram, der 
repraesenterer taleakteme "Troyans' trumpet" og "Troyan strumpet". 



l^mindelie dagligdags talesprog kan en taleakt som f.eks. "komme" realiseres fonetisk som 
[*g Amm]. Det er min primaere hensigt i det f0lgende at unders0g^ hvordan sprogbrugere 
identificerer raekken aTfoner i [’g^Anmy fra det akustiske signal. Sp0resmii om, livordan 
sprogbrugere - med afsaet i specifikke fonetiske repraesentationer - nar ftm til (intenderede) 
ord i en ytring, vil ikke blive behandlet. 
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troya n — s trumpe t 

Figur 1.2.1 Spektrogrammer, der repraesenterer ytringeme "Troyans' trumpet" og 
"Troyan strumpet". Bemaerk det akustiske resultat af forskellen i ordgranse: frikativen er 
laengere, nir den st^ i initial position, hvilket ogs& gaelder for [t]'s aspiration i "trumpet". 

(Fra Borden & Harris 1984: 195). 

Som det tydeligt fremgSr, er det ikke muligt i det akustiske signal at afdaekke 
isolerbare akustiske segmenter, der aekvivalerer det fonetiske segment. Netop 
dette forhold viser en fundamental forskel mellem tale og skrift: hvor skriften 
ofte er segmenteret i alfabetisk ortografi, er talen ikke segmenteret pS det 
akustiske niveau^. 




Fravaeret af akustisk segmentering er ikke en ulempe, tvaertimod er det en 
fordel (og m&ske n0dvendighed) ved menneskets tale som verbal 

^ Jeg fokuserer her udelukkende pk alfabetisk skrift og ser bort fra bl.a. ikoniske skrifttyper 
og stavelsesskrift. 
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kommunikation. Vi kan - med et vist besvaer - f0lge en talehastighed pS op til 
400 ord i minuttet (Orr et al. 1965). Med gennemsnitligt 4-5 fonemer per ord 
kan vi altsS forsta tale med omkring 30 distinktive segmenter pr. sekund. 
Samtidig ved vi fra den eksperimentelle perceptionspsykologi (Miller 1956), 
at 30 distinktive lyde langt overskrider 0rets temporale kapacitet: f.eks. 
vokallyde, der overf0res ved ca. 20 segmenter pr. sekund, falder sammen i 6r\ 
udifferentierbar tone. Da der selv i almindelig dagligdags talesprog overf0res 
15-20 distinktive segmenter pr. sekund (dvs. 15-20 fonetiske distinktioner, 
der adskiller ord, overf0res, identificeres og kombineres), er det indlysende, 
at sprogbrugere umuligt kan kommunikere disse fonetiske distinktioner som 
isolerede enheder. Endvidere viser en lang raekke perceptionsfors0g, at 
kontekstl0se sproglyde, f.eks. isolerede vokallyde, kan maskeres af en 
distraktionslyd op til 250 ms efter praesentationen (Massaro 1970, 1971, 1972, 
1975). I (danske) fors0g, hvor fors0gsdeltageme selv mS tilpasse fuld- 
vokalers laengde, viser det sig, at de foretraekker en varighed over 200 ms for 
en isoleret langvokal (Petersen 1976). Kort sagt kraever identifikation af 
isolerede sproglyde sS lang tids processering i forhold til talehastigheden, at 
akustisk segmentering ville vaere alt for tidskraevende i normale 
kommunikationssituationer. 

Akustisk integration 

Man kunne have forestillet sig, at det var muligt at finde konstante akustiske 
track til identifikation af fonemet, selvom fonemet ikke er en selvstaendig, 
isolerbar akustisk enhed. Dette er dog ikke tilfaeldet. Unders0gelser foretaget 
med Vocoder talesynthesizere^ giver endnu et fingerpeg om, hvorfor det 
generelt er umuligt at isolere fonetiske segmenter i talen. 

Figur 1.2.2 viser spektrogrammer, der repraesenterer de to konsonant-vokal- 
stavelser (herefter CV-stavelser) [di] og [du]. De eneste variabler, der 
behandles i synthesizeren, er de to formantfrekvenser samt grundtonen, der 
bliver holdt konstant ved alle stimuli. De m0rke bSnd i spektrogrammerne 
repraesenterer henholdsvis f0rste og anden formantfrekvens (herefter Fl og 



^ Den f0rste Vocoder-synthesizer blev udviklet af H. Dudley og bans kollegaer ved Bell 
Telephone Laboratorieme i slutningen af 1930*eme. Den blev oprindeligt udviklet med det 
formal at reducere bandbredden i f.eks. overs0iske telefonkabler, men blev aldrig nogen rigtig 
succes pi det omride. Derimod satte Vocoderen gang i udviklingen af talesynthesizere og 
havde derved stor indflydelse pi den senere udforskning af talesyntese og sprogperception 
(Lieberman & Blumstein 1988). 
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F2) som funktioner af tid. De to f0rste formanters relative frekvens er 
tilstraekkelig information til identifikation af vokalen"^. 




TIME IN MSEC. 



Figur 1.2.2 Spektrogrammer over syntetiske transitionsm0nstre, der repraesenterer CV- 
stavelseme [di] og [du]. Spektrogrammeme er hindmalede og kan aflaeses af en Vocoder 
talesynthesizer, der konverterer dem til 1yd. FI- og F2-information er medtaget, mens 
grundtonen ikke er repraesenteret i spektrogrammeme. Bemaerk at de to F2-transitioner 
peger i forskellig retning. (Fra Liberman, Cooper, Shankweiler & Studdert-Kennedy 1967: 
435). 



FI og F2's frekvens i naturlig tale bestemmes af taleorganemes - isaer 
tungens - position under udtalen; tungens relative h0jde determinerer FI's 
frekvens, hvorimod F2's frekvens determineres af tungens relative 
horisontale position, dvs. hvorvidt der er tale om en fortunge- eller en 
bagtungevokal. F.eks. er tungen haevet mod ganen ved udtalen af bade [i] og 
[u], hvilket betyder, at deres FI skal findes i nogenlunde samme 
frekvensomrade. Derimod er der relativ stor forskel i tungens position ved 
udtalen af henholdsvis [i] og [u]: [i] udtales med haevet fortunge, hvilket 
resulterer i en F2 naer 3000 Hz, mens [u] udtales med haevet bagtunge, hvilket 
resulterer i en F2 omkring 700 Hz. 



I begyndelsen af hver CV-stavelse bevaeger formanteme sig meget hurtigt 
gennem en raekke frekvenser. Ved [di] er der tale om en stigning fra omkring 
2200 Hz til 2600 Hz, hvor det i [du] drejer sig om et fald fra omkring 1200 til 
700 Hz. De hurtige frekvensskift, der hver varer ca. 50 millisekunder, kaldes 
formanttransitioner. Det er netop disse formanttransitioner, som lytteren 



^ Det skal dog tilf0jes, at vokallyde, der udelukkende best^ af to formanter, ikke lyder saerlig 
naturligt; de lyder snarere som dut-lyde end vokallyde. 

o 
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identificerer, nar han/hun ”h0rer” *d* (i modsaetning til ’b' eller *g’) i 
stavelseme. Det er her vaerd at bemaerke, at F2-transitionen i [di] og [du] er 
rettet fra samme frekvensomrade, nemlig 1800 Hz. Dette skyldes, at F2- 
transitionens locus^ er determineret af konsonantens artikulationssted, og 
artikulationsstedet lige f0r eksplosionen i [d] er omtrent det samme f0r alle 
vokaler. Straks efter eksplosionen i [d] begynder taleorganeme at glide mod 
vokalens artikulationsposition. Det er lige netop denne glidende overgang fra 
en artikulationsposition til en anden, der skaber formanttransitionerne^. Siden 
artikulationspositioneme for [i] og [u] er vaesentlig forskellige, er F2- 
transitioneme f0r vokaleme ogsk forskellige (Segalowitz & Gruber 1977). 

Det er en vigtig pointe, at det akustiske track, der determinerer perceptionen 
af [d], F2-transitionen, er vaesentlig forskellig foran [i] og [u]. Konsonanten 
[d] siges at vaere integreret i den efterf0lgende vokal’: det er f.eks. ikke 
muligt at producere transitionen uafhaengigt af en vokal; transitionen 
eksisterer kun i kraft af relationen til vokalen; der er ikke et specifikt akustisk 
segment, som svarer til det perciperede /d/-fonem. Den akustiske realisation 
af f.eks. /d/ i ^n stavelse er altsi noget anderledes end i en anden stavelse. Det 
er derfor heller ikke muligt at saette [d]’s formanttransitioner i [di] sammen 
med vokalen [u] for derved at konstruere stavelsen [du]. 

Denne specifikke egenskab ved integration - at der ikke eksisterer en 
korrespondens mellem det akustiske signal og individuelle fonemer - regnes 
for at vaere det mest essentielle karakteristikum ved talen (Lieberman & 
Bloomstein 1988). Liberman og bans kollegaer i Haskins-gruppen er nok dem 
der mest eksplicit har redegjort for dette synspunkt: 

"Acoustic cues for successive phonemes are intermixed in the sound stream to such an extent 
that definable segments of sound do not correspond to segments at the phoneme level. 



^ Forholdet mellem F2-transitioners loci - eller "begyndelsesfrekvenser" - og artikulationssted 
er blevet studeret indgaende bl.a. i Delattre et al. 1955. 

^ Formanttransitioneme for&rsages ikke af vokalens stemthed; selv i taleakter uden stemthed, 
f.eks. nSr der hviskes, er det muligt at f0lge formanttransitioneme. 

’ Det saerlige forhold, at konsonanters formanttransitioner er en integreret del af vokalen, 
kaldes i den engelsk-amerikanske litteratur for "encodedness" (se f.eks. Liberman et al. 1967; 
Segalowitz & Gruber 1977; Lieberman & Bloomstein 1988; Borden & Harris 1984, etc.). leg 
har her valgt betegnelsen "integration", da der snarere er tale om effekten af artikulatorisk inerti 
end en egentlig intentionel kodning. Det kan undre mig, at Liberman et al. explicit har valgt at 
anvende en terminologi, der stammer fra et belt andet videnskabsparadigme, nemlig 
kryptografien, og derved antyder, at der i talen skulle eksistere en arbitraer relation mellem en 
original og en kodet form (jf. Liberman et al. 1967). 
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Moreover, the same phoneme is most commonly represented in different phonemic 
environments by sounds that are vastly different. There is, in short, a marked lack of 
correspondence between sound and perceived phoneme” (Liberman, Cooper, Shankweiler & 
Studdert-Kennedy 1967: 432). 

Varians 

Som det fremgik af det ovenstaende, er segmenterne i det akustiske signal 
integreret i hinanden med den konsekvens, at det ikke er muligt at afdaekke en 
en-til-en korrespondens mellem det akustiske signal og de fonetiske 
segmenter. Der er altsa kun en indirekte relation mellem den fonetiske 
repraesentation og det akustiske signal, som den udspringer af, og denne 
relation er yderst kompliceret. Pa den ene side kan forskellige akustiske traek 
producere samme fonetiske kontrast, men pa den anden side kan flere 
fonetiske kontraster ogsi manifesteres ved samme akustiske traek (Fitch et al. 
1980 ). 
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Mange-til-en korrespondens mellem det akustiske signal og det fonetiske 
segment skyldes oftest kontekstbetinget variation i de akustiske track. Et 
eksempel pk variation i det akustiske signal er figur 1.2.3, der viser en serie 
spektrogrammer af [b], [d] og [g] i forskellige CV-stavelser. Det er isaer vaerd 
at bemaerke, at F2-transitionens retning i "samme" konsonant varierer 
afhaengigt af den efterfdlgende vokal. 

En-til-mange korrespondens mellem det akustiske signal og det fonetiske 
segment er ligeledes en konsekvens af de akustiske segmenters integration. I et 
bemaerkelsesvaerdigt fors0g udf0rt af Carol D. Schatz (Schatz 1954) havde 
hun splejset eksplosionen fra naturligt producerede CV-stavelser sammen med 
vokaleme [i], [a] og [u]. Ved praesentation for en raekke fors0gspersoner blev 
samme naturligt produceret eksplosion ved 1440 Hz identificeret som 
henholdsvis [p] og [k] afhaengigt af, om den efterf0lgende vokal var [i] eller 
[a]^ Liberman, Delattre og Cooper (1952) havde tidligere naet til samme 
resultat med syntetiske stimuli, hvor eksplosionen ved 1440 Hz blev 
identificeret som [k] foran [a], men som [p] bade foran [i] og [u]. 

Akustisk invarians 

En af konsekvenseme af de akustiske segmenters integration er altsa, at det 
akustiske signal ikke kan segmenteres i st0rrelser, der svarer til fonemer. 
Sp0rgsmSlet mk herefter vaere, om der eksisterer invariante akustiske 
st0rrelser, som sprogbrugere kan anvende i perceptionen af taleakter 
realiseret i et akustisk signal. 

Det er min hensigt i det f0lgende at opsummere nogle af de vigtigste og mest 
relevante resultater af fors0g pk at afdaekke invariante track i det akustiske 
signal. Resultateme vil blive pracsenteret i afsnit, der dackker forskellige 
omrSder som f.eks. 'locus', F2, F3 og friktionsst0j (dackker her eksplosions- 
st0j, aspirationsst0j og friktionsst0j i traditionel forstand). 

Resultateme i det f0lgende stammer bade fra fors0g med syntetiske stimuli 
produceret ved hjaclp af talesynthesizere, naturlig tale samt spektrografiske 
analyser. 



* I Liberman, Delattre og Coopers (1952) oprindelige forspg var de syntetiske stimuli 
produceret ved hjaclp af en talesynthesizer. Carol D. Schatz anvendte derimod naturlig tale, 
som blev redigeret i en bindmasidne. 
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En lang raekke unders0gelser af de akustiske traek, som g0r det muligt for 
sprogbrugere at identificere stavelser og ord, bygger pa kontrollerede 
eksperimentelle metodologier. Typisk varieres et akustisk traek i stavelser 
eller ord, der i anden henseende er invariante. Disse stimuli praesenteres 
derefter under naer optimale forhold for en raekke fors0gspersoner, som 
bliver bedt om at identificere de praesenterede stimuli. Pa den made er det 
muligt at afg0re et akustisk traeks relevans for fonetisk perception (Bond 
1981). 

Locust en akustisk invarians? 

Antagelsen om loci (eller formanters hypotetiske begyndelsesfrekvenser) som 
mulige invariante akustiske traek tager afsaet i det problem, som vi blev 
praesenteret for i figur 1.2.3, nemlig at formanter i "samme” konsonant 
varierer med den efterf0lgende vokal. 

iEndringer i formanttransitionemes grafiske repraesentation skyldes, at 
taleorganeme i l0bet af taleakten glider fra en position mod en anden. Med 
andre ord afspejler formanttransitioneme aendringer i mundhulrummets 
st0rrelse og form forarsaget af taleorganemes bevaegelse. Da konsonantemes 
artikulationssted er relativt konstant, er det en naerliggende tanke, at man mk 
kunne beskrive deres locus - eller "begyndelsesfrekvenser". 

Hvis man i figur 1.2.3 ekstrapolerer de forskellige F2-transitioner, som 
karakteriserer den enkelte konsonant, tilbage i tid, ser vi, at de alle peger mod 
samme frekvensomrSde. Ud fra en antagelse om, at transitionemes f0rste del 
mangier, kan man altsS reducere de mange forskellige F2-transitioner til et 
artikulatorisk og akustisk locus. 

I figur 1.2.3 er [d] tydeligvis det bedste eksempel med en konstant F2- 
frekvens pS 1800 Hz. F2-transitioneme i [b] er derimod alle stigende^ hvilket 
betyder, at [b]’s locus skal findes i et lavere frekvensomrMe end den laveste 
F2-frekvens (dvs. < 800 Hz). Det mest komplicerede eksempel er [g], hvor 
det ikke er muligt at reducere F2-transitioneme til et locus. Man ma her 
antage, at der er et h0jfrekvens-locus pa 3000 Hz eller derover for 



’ Da locusbegrebet oftest anvendes om artikulationssted og (det akustiske resultat) F2, kan 
man let forledes til at tro, at locusbegrebet er begraenset til disse omrider. Med ’locus' 
refereres der ganske enkelt til det frekvensomrSde, som man antager, en transition udspringer 
af, og som transitionens grafiske repraesentation peger mod - uanset transitionens Srsag Of 
Delattre et al, 1955). 
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fortungevokaleme [i], [e] og [e], og et lavfrekvens-locus for bagtunge- 
vokaleme [o], [o] og [u] omkring 1200 Hz. 

I en raekke fors0g med stimuliene [b], [d] og [g] fors0gte Delattre, Liberman 
og Cooper i 1955 at finde eksperimentel evidens for teorien om loci som 
invariante akustiske traek. Hensigten med unders0gelseme var at fastsli (1) 
om loci er kontekstuafhaengige; (2) om locusbegrebet er relevant i forbindelse 
med Fl-transitioner; (3) om loci udg0r transition ers begyndelsesfrekvenser 
eller om loci blot er frekvensomrader, transitioneme er rettet mod. 




Figur 1.2.4 Skema over stimuli, der blev anvendt i fors0get pk at finde [b], [d] og [g]'s 
F2-loci. A: 13 konstante F2-frekvenser og 5 Fl-frekvenser med transition, der kombineret 
udgjorde 65 stimuli. B: Et eksempel pk en typisk teststimulus best^ende af de to formanter, 
derermaAere^A|^^^DelatUjeXibennai^^o^en955)^^^^^^^^^^^^^ 



I f0rste omgang anvendte Delattre et al. en teknik, hvor de prasenterede 
stimuli - i alt 65 - bestiende af (5 • 13) Fl-F2-kombinationer. Som det frem- 
g^ af figur 1.2.4 var alle F2 uden transitioner, hvilket var n0dvendigt for at 
fk F2 til at udpege (i bogstavelig forstand) locusfrekvenseme. F2 er uden 
transition, er det desuden tvingende n0dvendigt, at FI bar transition, hvis en 
del af en stimulus overhovedet skal kunne identificeres som en klusil; ellers 
vil den blive identificeret som en vokalisk 1yd. 



Resultatet af f0rste fors0g svarer meget godt til de ekstrapolerede F2- 
transitioner i figur 1.2.3: det bedste eksempel p^ [g] bar en F2-frekvens pa 
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3000 Hz, det bedste [d] pk 1800 Hz og [b] pk 720 Hz. Andre F2-frekvenser 
gav en mere eller mindre vellignende klusillyd afhaengigt af afstanden til en af 
de tre ovennaevnte F2-loci. Ved en F2 pi 1320 Hz var lyden et udifferentier- 
bart [b], [d] eller [g]. Med hensyn til Fl-transitionens betydning for de tre loci 
er konklusionen entydig: 

it appears that the second-formant loci are independent of the changes in vowel color that 
are produced by varying the position of the first formant" (Delattre et al. 1955:92). 

I en anden unders0gelse fors0ger Delattre et al. at fastsla, om F2-transitionen 
begynder ved dens locus, hvorefter den glider over i en steady-state vokal, 
eller om F2-transitionen blot er rettet mod dens locus. Som det fremgir af 
figur 1.2.5 anvendte Delattre et al. et af resultateme fra den f0romtalte 
unders0gelse, nemlig frekvensen for [d]’s locus, som det blev fastslaet er pa 
1800 Hz. Raekken af stimuli varierer med hensyn til F2's bevaegelse fra 1800 
Hz til en steady-state vokal, hvorimod FI er holdt konstant med et onset, der 
er synkroniseret med F2's onset. 




Figur 1.2.5 Skema over stimuli og deres identifikation - med og uden pause mellem 
locus og transitionemes onset. A: F2-transitioner, der begynder ved [d]'s locus og derefter 
glider mod forskellige steady-state vokaler. FI er konstant for alle stimuli. B: Samme 
stimuli som i 'A', blot med en 50 ms pause mellem locus og F2-transitionens onset. 
Bemaerk at der ikke er nogen pause i FI , men at FI er forskubbet, sS dets onset er 
synkroniseret med I^'s onset. (Fra Delattre, Liberman & Cooper 1955). 



Resultatet af identifikationstesten er bemaerkelsesvaerdigt: pi trods af at F2- 
transitionen i alle stimuli begynder i [d]’s locus, blev ikke alle stimuli 
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identificeret som [d] (jf. figur 1.2.5 A.). Derimod blev stimuli med en F2- 
frekvens mellem 2040 og 2520 Hz identificeret som [b], mellem 1560 og 1920 
Hz som [d], mellem 1200 og 1440 Hz som [g], og under 1200 Hz igen som [d]. 

Da Delattre et al. derefter indsatte en pause mellem locus og transitionens 
onset ved at slette de fprste 50 ms (jf. figur 1.2.5 B.), blev alle stimuli 
identificeret som et mere eller mindre vellignende [d]. Fors0g med stimuli, 
der tog udgangspunkt i henholdsvis [b] og [g]’s locus, gav lignende resultater: 

"It is reasonably clear in these cases, as it was with that the transition cannot start at the 
locus and go all the way to the steady state" (Delattre et al. 1955: 94). 

Om transitionen begynder ved locus eller blot er rettet mod locus er alt- 
afgprende for relevansen af locus som invariant akustisk trxk. Der er ingen 
tvivl om, at locus kan defineres akustisk, altsi som et bestemt frekvens- 
omrade, og artikulatorisk som et bestemt artikulationssted. Men da det er 
npdvendigt at slette den fprste del af transitionen, sa den ikke begynder i 
locus, kan locus umuligt udgpre et relevant, invariant trask for identifikation 
af konsonanten. Locus er simpelthen ikke en (relevant) del af det akustiske 
signal. 

Derimod er der ingen tvivl om, at locus er en reel artikulatorisk konstant. Det 
artikulatoriske lukke er konstant for alle [d] i CV-stavelser relativt uafhasngigt 
af den efterfplgende vokal. Ifplge beregninger foretaget af Stevens & House 
(1956) er mundhulrummets resonansfrekvens ved lukket pa omkring 1800 
Hz. Men da der ikke produceres 1yd, f0r taleorganeme er begyndt at ibne, 
indgar locus ikke direkte i det akustiske signal. Selvom locus umiddelbart er 
et mere invariant traek for fonemet end transitioneme selv, er dets invarians 
afledt og naermere relateret til artikulatoriske forhold end akustiske. 

Akustisk invarians i F2-transitioner 

I det foregiende bar jeg beskrevet den varians, der kendetegner klusileme. Et 
af de vaesentligste akustiske traek for perceptionen af klusiler er F2- 
transitioneme, der signalerer artikulationssted. Manglen pa invarians i F2- 
transitioner, som feks. i [d], er karakteristisk for savel aspirerede som 
uaspirerede klusiler samt nasaleme (Liberman et al. 1954). Det er i disse 
konsonanter, at "the acoustic-phonetic noninvariance problem" kommer 
tydeligst til udtryk (Klatt 1979). 
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Den st0rste grad af diskontinuitet skal nok findes i de velaere lukkelyde [k], [g] 
og [g]. Ikke alene har de varierende F2-transitioner afhaengigt af den 
efterf0lgende vokal, men ogsa varierende loci, der er betinget af konteksten. 
F.eks. er der et betydeligt skift i konsonantens locus-frekvens mellem CV- 
stavelser med henholdsvis rundede og urundede vokaler (Liberman et al. 
1967). Disse forhold er netop med til at skabe en kompleks relation mellem 
det akustiske signal og de fonetiske segmenter. 

Hos sonoranteme [r], [1], [w] og [j] ser vi ikke samme kompleksitet mellem 
akustisk signal og fonetisk segment, da F2-transitionen i disse konsonanter har 
deres begyndelse ved et relativt invariant locus*®, hvilket ikke er tilfaeldet med 
klusiler og nasaler. Derimod er F2-transitioneme i sig selv ikke spor 
konstante - ogsS her er variationen betinget af den efterf0lgende vokal 
(O'Connor et al. 1957). 

Akustisk invarians i F3-transitioner 

Er det sk muligt at fmde invariante track for perception i F3-transitioneme? 
Vi mk starte med at konstatere, at der ikke er blevet forsket saerlig meget i 
F3-transitioner og deres betydning for perceptionen. Grunden til dette er, at 
F3 0jensynligt ikke har den store betydning for andet end perceptionen af 
nasale konsonanter (Lisker et al. 1957), og selv for de nasale konsonanter er 
der ikke noget, der tyder pa, at F3-transitionen udg0r et invariant akustisk 
track (Harris et al. 1958; O'Connor et al. 1957; Liberman et al. 1967). 

Faktisk synes "the acoustic-phonetic noninvariance problem" at blive 
yderligere kompliceret, da F3-transitionens vigtighed er relativ i forhold til 
den fonetiske kontekst - isacr F2-transitionerne. I eksempler som [di]-[du], jf. 
figur 1.2.2, fandt Liberman et al. (1967), at en passende F3-transition for- 
bedrer muligheden for en korrekt identifikation af [d] i [di], men slet ikke i 
[du]. Det er sandsynligt, at F3-transitionen indvirker p^ perceptionen i 
bestemte formant-konstellationer, men det er samtidig muligt at fastsla, at F3 
i endnu mindre grad end FI og F2 kandiderer til rollen som invariant 
akustisk track. 



Dette er i h0j grad tilfaeldet for [w], men mindre for [r], [1] og [j]» hvilket skyldes 
artikulatoriske forhold. 
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Invarians i friktionsst0j ^* 

St0j, der dannes som friktionsst0j i taleakten, hvad enten den findes som 
laengere passager i frikativer eller som kortvarig eksplosionsst0j i klusiler, er 
et andet akustisk traek for identifikation af konsonanteme - isaer deres 
artikulationssted. 

Pa den ene side har vi en raekke tilfaelde, hvor friktionsst0jen er relativt lang, 
typisk i frikativer, som almindeligvis ikke er underlagt den store kontekst- 
betingede variation*^ Siden det akustiske traek, der er forbundet med 
friktionsst0jen, er altoverskyggende i perceptionen af [S] og [S], ma vi 
konstatere, at disse frikativer udviser en lav grad af restrukturering i det 
akustiske signal. Friktionen udg0r med andre ord en undtagelse, da den ikke i 
samme grad er integreret i de omkringliggende akustiske segmenter, som vi 
tidligere har set det med mange andre akustiske traek (Liberman et al. 1967). 

Pa den anden side har vi ogsa friktionsst0j i klusileme, hvor en kortvarig 
eksplosionsst0j udg0r det akustiske resultat af artikulationen. Klusilemes 
eksplosionsst0j er dog mindst lige sa restruktureret og diskontinuert et traek 
som klusilemes formanttransitioner. 

I fors0g udf0rt af Liberman et al. (1952) har man fors0gt at producere de 
bedst mulige klusiler [k] og [g] ved hjaelp af syntetiske spektrogrammer. Her 
viser det sig, at eksplosionsst0jens frekvens er direkte relateret til den 
fonetiske kontekst - i dette tilfaelde den efterf0lgende vokal . Faktisk varierer 
eksplosionsst0jens frekvens over sa stort et omrade, at det overlapper med det 
frekvensomrMe, som producerer det bedste [b] og [p]. Resultatet af dette er, 
som tidligere beskrevet i afsnittet "Varians", at der opstar en en-til-mange 
korrespondens mellem det akustiske signal og det fonetiske segment, f.eks. 
identiflceres en eksplosionsst0j ved 1440 Hz som henholdsvis [p] foran [i] og 
[k] foran [a]. 

Endelig skal det pointeres, at eksplosionens vigtighed er relativ og varierer 
for samme klusil i forskellige kontekster, hvilket ogsa gaelder for F2- 
transitionen. F.eks. er det n0dvendigt for [g] og [k], der er markeret med en 
kraftig F2-transition f0r [ae], at deres eksplosionsst0j falder inden for et n0je 

* ‘ Friktionsst0jens relevante fysiske variabel er et (i spektrogrammer lodret) intensitetsbands 
frekvens. 

Dog assimileres rundingen fra en efterf0lgende vokal; sammenlign f.eks. [s] i sile-syle og 
stirre-styre. 
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afgraenset frekvensomrade, hvis de skal kunne identificeres foran [o]^^, Med 
andre ord kan samme konsonant i forskellige kontekster afhaenge af sa 
forskellige akustiske traek som friktionsstdj og formanttransitioner*'*. 



Disse resultater stammer fra fors0g med eksplosionsst0j og transitioner som akustiske traek 
for idemifikation af klusiler (Liberman et al. 1952, 1954). 

Se Repp (1982) for en gennemgang af forskellige typer 'trading relations'. 
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1.3 Teorier om sprogperception 

Forudsat at der ikke eksisterer diskrete, invariante track for de distinktive 
fonemer, rejser der sig nogle belt centrale sp0rgsmM: (1) hvordan forholder 
de fonetiske segmenter sig til det akustiske signal? og (2) ved hvilke processer 
restrukturerer lytteren de fonetiske segmenter fra det akustiske signal? 

To generelle tendenser i dannelsen af teorier om sprogperceptionen bar vaeret 
dominerende i den videnskabelige debat. I den ene gruppe af teorier (ber 
repraesenteret ved bl.a. signal-detektor-teorien, jf. side 43ff) beskrives 
lytteren som relativt passiv og selve perceptionsprocessen som primaert 
sensorisk. Det akustiske signal modtages, filtreres og sammenstilles sa direkte 
med de akustiske-fonetiske track pS det pagacldende sprog. 

Den anden gruppe af teorier (synteseteorieme, ber repraesenteret ved 
Motorteorien og Analysis-by-Syntbesis-teorien) anser lytteren for at vacre 
mere aktiv og baevder desuden, at perceptionsprocessen indebolder visse 
aspekter af produktionsprocessen; det akustiske signal modtages og analyseres 
for fonetiske egenskaber i benbold til, bvordan de enkelte lyde produceres. 

Svnteseteorier 

Der er to generelt accepterede teorier om fonetisk sprogperception, som 
fokuserer pa relationen til sprogproduktion*: Motorteorien, repraesenteret ved 
Alvin M. Liberman og en raekke af bans kollegaer ved Haskins- 
Laboratorierne i New Haven, Connecticut, og Analysis-by-Syntbesis-teorien 
repraesenteret ved Kenneth N. Stevens og Morris Halle ved Massachusetts 
Institute of Technology. 

Begge teorier udspringer af de store forventninger om at kunne afdaekke en 
en-til-en korrespondens mellem det akustiske signal og fonemer, man havde i 
den f0rste halvdel af dette Srhundrede. Men det er svaert - hvis ikke 
umuligt - at finde konstante akustiske track til identifikation af fonemer. Det 
var derfor n0dvendigt at udvikle en model, der omfatter fonemer i de 

' En tredje, men ikke udbredt teori bygger pS Gibson-paradigmet (Gibson 1966), hvor alle 
former for perception sammenholdes med stimulationens oprindelse. Hos Gibson anses 
perceptionen af sprog ikke som noget grundlseggende andet end perception af auditive (og 
visuelle) signaler, men taleorganemes specielle natur fremhaeves og sprogperceptionen regnes 
derfor som speciel, fordi sprogets oprindelse er speciel (jf. ogsS C.A. Fowlers 'Direct-Realist' 
perspektiv, Fowler 1986). Denne teori vil Ucke blive yderligere uddybet her, da den har en 
perifer status i den aktuelle debat om sprogperception. 



Teorier om sprogperceplion 



perceptuelle processer, men som ikke kraever, at fonememe identificeres ud 
fra diskxete, invariante traek i det akustiske signal^. 

I en tidlig formulering af en perceptionsteori baseret pa syntese, antog man, 
at talegenkendelse var baseret pa, at det akustiske signal kunne matches med 
en idealiseret form, en skabelon^ Man antog, at modtageren, efter at have 
perciperet det akustiske signal, begyndte at generere eller syntetisere en 
psykoakustisk skabelon, som sa kunne sammenholdes med det perciperede. 

Med den tidlige synteseteori l0b man hurtigt ind i et centralt problem: der er 
mere end ^n taler i verden. Sammenstillingen af akustiske traek med fonetiske 
segmenter - ogsa kaldet "the acoustic-phonetic mapping" (Clark & Clark 
1977: 205) - varierer fra taler til taler, og endda fra taleakt til taleakt hos 
samme taler. Enhver form for variation, hvad enten det drejer sig om inter- 
eller intraindividuel variation, fprer til en ny akustisk-fonetisk sammen- 
stilling. Da variationen er potentielt infinit, ville det vaere n0dvendigt med et 
infinit antal af disse skabeloner, hvis en positiv identifikation af det 
perciperede skulle vaere mulig (Harley 1995). 

Netop sp0rgsmalet om, hvordan det perciperede signal matches med en 
skabelon og problemer vedr0rende skabelonens karakter, har f0rt til en 
raekke forskellige l0sninger og modeller inden for synteseparadigmet. Faelles 
for teorieme er dog, at de bygger pi en antagelse om, at lytteren er aktiv 
deltager i en proces, hvor det akustiske signal matches med en idealiseret 
form; om den idealiserede form sa er af en akustisk eller en motorisk 
karakter er netop det skelsaettende. 



Motorteorien 

En af de mest kendte og omdiskuterede varianter af synteseteorien er 
Motorteorien. Den oprindelige Motorteori tog, som de andre synteseteorier, 
udgangspunkt i en formodning om, at der eksisterer en direkte korrespondens 
mellem det akustiske signal og de fonetiske segmenter. Unders0gelser viste 



^ Pi trods af, at tanken om, at fonemer kan identificeres ved syntese af invariante akustiske 
trask (altsa en aktiv perceptionsproces) ikke regnes for plausibel i modeme psykolingvistik og 
perceptionsteori, eksisterer der flere fremtrasdende varianter af teorien. Den mest kendte og 
udbyggede model er Klatts LAFS-model - Lexical Access From Spectra (Klatt 1989). 

^ Jeg bar valgt at anvende betegnelsen 'skabelon' for 'template', som almindeligvis anvendes i 
den engelsksprogede litteratur. Efter min opfattelse associerer 'skabelon' med en idealiseret 
fysisk form eller blueprint, hvilket netop svarer til de tidlige beskrivelser af 'template 
matching'. 
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dog snait, at det ikke er tilfaeldet; det var ikke muligt at give en entydig 
akustisk beskrivelse af alle fonemer. Fravaeret af akustisk invarians - det 
sSkaldte ’acoustic-phonetic noninvariance problem' - udgjorde et grund- 
laeggende problem for teorier, der antog, at talen bestar af sekvenser af 
fonetiske realisationer. Med Motorteorien indledtes i 1950’erne og 1960’erne 
et fors0g p5 at fastholde fonemet som en perceptuel enhed. 

Det centrale punkt i Motorteorien er, at den fokuserer pk, at lytteren pa andre 
tidspunkter er taleren og at lytteren anvender sin viden om artikulatoriske 
forhold i afkodningen af det akustiske signal"*. Med andre ord bygger 
perceptionsmodellen pa den hypotese, at forholdet mellem det akustiske signal 
og de fonetiske segmenter medieres af mekanismer, der indgar i produktionen 
af tale, artikulationen, hvorfor teorien generelt er kendt som 'the Motor 
Theory of Speech Perception’: 



"The listener uses the inconstant sound as a basis for finding his way back to the articulatory 
gestures that produces it and thence, as it were, to the speaker's intent" (Liberman, Cooper, 
Shankweiler & Studdert-Kennedy 1967: 453). 

Da akustisk kodning fortrinsvis forirsages af koartikulation (jf. kap. 2.1), er 
det da ogsa naerliggende, at viden om artikulation og taleorganemes dynamik 
har en vaesentlig funktion i afkodningen af det akustiske signal. 

Motorteoriens to hvpoteser 

Motorteorien har fra begyndelsen af 1950*eme til i dag gennemgaet en stadig 
udvikling og aendret selv centrale postulater i samspil med empiriske 
unders0gelser og fagfolks kritik. Teoriens udvikling er selv af kritikere 
blevet karakteriseret som kontinuerlig indtil 1985, hvor teoriens grund- 
laeggende princip (the Motor Command Principle) blev udsat for en 
gennemgaende revision. Jeg mener derfor, at det er rimeligt at fremlaegge 
Motorteoriens udvikling i to faser, inddelt efter omfanget af teoriens 
postulater, som jeg vil referere til som henholdsvis 'staerk motor hypotese’ og 
’svag motor hypotese’ (Clark & Clark 1977; Liberman & Mattingly 1985; 
Mattingly & Studdert-Kennedy 1991). 



^ Der er nok ingen tvivl om, at vi anvender vores viden om artikulationsforhold, nar vi lytter. 
Det er en anerkendt og dokumenteret antagelse, at vi ogsl traekker pa det visuelle i tolkningen 
af det akustiske signal. De visuelle signaler, som feks. laeberunding ved vokaler, er dog 
hverken n0dvendige eller tilstraekkelige, men blot en hjaelp i fortolkningen af almindelig 
dagligdags tale, og de vil derfor ikke blive behandlet naermere her. 
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Et tidligt udkast til Motorteorien antog en staerk hypotese, der bygger pk en i 
dag absurd antagelse, nemlig at lytteren producerer en slags ’’indre monolog”, 
der sa kan matches med det perciperede signal for identifikation (Crystal 
1995). En lang raekke unders0gelser og fors0g taler kraftigt imod en 
antagelse som denne. 

For det f0rste er der intet der tyder pa, at sprogbrugere producerer en eller 
anden form for subvokal monolog, mens man taler til dem. Der er simpelt- 
hen ingen former for aktivitet i de muskier, der almindeligvis indgar i 
artikulationen. 

For det andet, hvis mekanismer der indgar i taleproduktion var en n0dvendig 
betingelse for en perceptionsproces, ville personer, som af neurologiske 
arsager ikke kan tale, heller ikke vaere i stand til at forsta tale. Bl.a. 
Lenneberg (1962) har rapporteret en raekke tilfaelde med personer uden tale, 
der ikke har nogen problemer overhovedet med at forsta tale. Og mere 
generelt implicerer Motorteoriens staerke hypotese, at sprogbrugere ikke kan 
forsta mere end de kan producere^. Det forholder sig snarere lige omvendt. 
Vi kan alle almindeligvis forsta sprogbrugere, som har en anden udtale end 
vores egen. F.eks. har personer der stammer, mandlige sprogbrugere, b0rn, 
dialekttalende, personer med udenlandsk accent, etc. ikke saerlige forstaelses- 
problemer, nkr de kommunikerer med voksne kvindelige sprogbrugere, der 
ikke stammer eller har en saerlig accent. 

Den oprindelige Motorteori, som beskrevet i Cooper et al. (1952), Delattre et 
al. (1955) og Liberman et al. (1959), og senere uddybet i Liberman et al. 
(1967), udvikledes s&ledes til en mere generel perceptionsteori med en lineaer 
model over, hvordan lyttere kan identificere segmentale fonemer uden 
reference til invariante akustiske track: Fk trods af en ringe korrespondens 
mellem det akustiske signal og de fonetiske segmenter, indebaerer 
produktionen af fonemer en reference til et saet invariante motoriske 
kommandoer; perceptionen af fonemer kan saledes ogsa medieres af en 
reference til de samme invariante motoriske kommandoer: 



^ Dette gselder i hvert fald ikke personer, der er stumme. Mere generelt virker det i 0vrigt 
usandsynligt, at sprogbrugere ikke kan forstS mere end de kan producere. I forbindelse med 
sprogtilegnelse forholder det sig snarere lige omvendt, hvadenten det drejer sig om 
modersmilstilegnelse, andet- eller fremmedsprogstilegnelse: Vi kan almindeligvis skelne 
mellem meget mere end vi kan identificere, og vi har ogsl lettere ved at identificere end 
producere. 
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"The assumption is that at some level or levels of the production process there exist neural 
signals standing in one-to-one correspondence with the various segments of the language - 
phoneme, word, phrase, etc. Perception consists in somehow running the process backward, 
the neural signals corresponding to the various segments being found at their respective levels. 
In phoneme perception - our primary concern in this paper - the invariant is found far down in 
the neuromotor system, at the level of commands to the muscles" (Liberman, Cooper, 
Shankweiler & Studdert-Kennedy 1967: 454). 

Denne lineaere perceptionsmodel er nok den mest kendte af Motorteoriens 
varianter og er oftest den model, der refereres til med betegnelsen ’the Motor 
Theory of Speech Perception'^. Motorteorien postulerer i denne form, at 
perceptionen af tale medieres af viden om artikulationsprocessen. Talen skulle 
altsa ikke perciperes ved analyse af det auditive signal, men derimod ved en 
speciel proces, som giver lytteren mulighed for at udlede de artikulatoriske 
kommandoer, der kraeves for at producere det akustiske signal. 

En vigtig type unders0gelser, der underbygger hypotesen om korrespondens 
mellem artikulatoriske kommandoer og fonemer, er fors0g med sproglydes 
oplevede styrke. Lehiste & Peterson konstaterer (1959), at vokaler udtalt med 
samme anstrengelse er meget forskellige med hensyn til maengden af akustisk 
energi, f.eks. indeholder [i] meget mere akustisk energi end [o] pa trods af, at 
talere oplever dem som udtalt med samme styrke. De praesenterede vokaler 
med ens maengde akustisk energi for en raekke fors0gspersoner og bad dem 
vurdere deres relative styrke. Konsekvent vurderede fors0gspersoneme, at [o] 
var meget kraftigere end [i] pa trods af en ens maengde akustisk energi i de to 
stimuli. Med andre ord, konkluderer Lehiste & Peterson, vurderer 
fors0gspersoneme, at vokaleme har samme styrke, ikke nar de bestar af 
saunme maengde akustisk energi, men nar de antages at blive udtalt med 
samme artikulatoriske anstrengelse. Lytterens model af talerens taleorganer 
og deres artikulatoriske dynamik er altsa belt essentiel; perceptionen knytter 
sig snarere til antagelser om artikulatoriske forhold hos taleren end det 
faktiske akustiske signal, som antagelseme udspringer af. 

En anden vigtig type materiale er unders0gelser som viser, at perceptionen 
betinges af lytterens forventninger, baseret pa bans viden om 

artikulations(u)muligheder (Borden & Harris 1984). Med ’forventninger’ 



® TO^dder betegnes denne variant ogsl 'the Motor Command Theory' (se f.eks. MacNeilage 
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refererer jeg altsa udelukkende til forventninger om artikulatoriske forhold 
og ikke til betydningsorienterede forventninger, der udspringer af top-down- 
analyser. Det skal pointeres, at denne Motorteori bygger pa en lineaer model 
udelukkende med bottom-up-analyser. Et interessant fors0g udf0rt af 
Dorman, Raphael og Liberman (1979) viser, at lyttere ikke perciperer 
lydkombinationer, som ikke kan vaere produceret af menneskelige tale- 
organer. Ved praesentationen af [ebde] kunne fors0gspersoneme ubesvaeret 
identificere lukket i [b] og eksplosionen i [d]. Men nir de to klusiler blev 
rykket taettere sammen - si taet, at det ikke er muligt at producere med 
menneskelige taleorganer - var fors0gspersoneme ikke laengere i stand til at 
identificere det f0rste lukke, men h0rte den syntetiske stimulus som [ede]. I en 
variant af samme fors0g havde Dorman, Raphael og Liberman produceret 
[Eb] med en stemme og [de] med en anden stemme. I dette tilfelde 
identificerede fors0gspersoneme [ebde] uanset hvor taet de to stavelser var 
rykket sammen. Lytterens forventninger har en stor betydning for 
perception, ikke mindst de forventninger, der knytter sig til lytterens viden 
om artikulationens muligheder og umuligheder. . 

Senere formuleringer af Motorteorien (Liberman & Mattingly 1985) 
postulerer, at invariante relationer udelukkende eksisterer pi det 
artikulatoriske niveau. Denne ekstreme formulering af Motorteorien 
insisterer pi, at en 6n-til-6n relation udelukkende eksisterer mellem 
lingvistiske elementer og motoriske kommandoer. Den pistand stemmer dog 
ikke saerlig godt overens med data fra mange irs unders0gelser (Lieberman & 
Blumstein 1988). 

If0lge Motorteorien fortolkes det akustiske signal ved hjaelp af motoriske 
kommandoer, der er n0dvendige for at producere et tilsvarende akustisk 
signal. Da artikulatorisk invarians i produktionen af et bestemt fonem ikke 
n0dvendigvis resulterer i akustisk invarians, kan man med denne teori fors0ge 
at undslippe 'the acoustic-phonetic noninvariance problem'. Men det har 
endnu ikke vaeret muligt at finde direkte korrespondens med fonemet, 
hverken i artikulatoriske data eller i akustiske data. Man har altsi haft mindst 
lige si ringe held med at s0ge fonemrepraesentationer i diskrete muskel- 
aktiviteter som i diskrete akustiske forandringer. En elektromyografisk 
unders0gelse (MacNeilage 1970) demonstrerer tydeligt, at det ikke er muligt 
at finde artikulatorisk invarians ved produktionen af fonemer. Man havde 
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forventet at kunne afdaekke en 6n-til-en relation mellem neuronaktiviteten, 
taleorganemes muskier og de sakaldte artikulatoriske kommandoer: 

"A great merit of the Motor Command Theory [:Motorteorien som den fremtraeder i Liberman 
et al. 1967 - TOM] was that it was testable. Electromyographic studies by myself and others 
(for a summary of these studies, see MacNeilage, 1972) showed that rather than being 
invariant, the motor commands reaching the muscles for a given phoneme varied with the 
coarticulatory demands of both adjacent and nonadjacent segments, with stress levels and with 
speaking rate” (MacNeilage 1991: 61 f)- 

En ensidig fokusering pS det artikulatoriske l0ser altsi ikke invarians- 
problemet, men forskyder det blot til et "motor-phonetic noninvariance 
problem" (Warren 1983: 288f). 

Konklusionen er altsa, at Motorteoriens staerke hypotese mi forkastes, for det 
f0rste, fordi dens praemisser slet ikke stemmer overens med forhanden- 
vaerende data, og for det andet, fordi den blot komplicerer den allerede 
indviklede relation mellem 1yd og fonem. Motorteorien kan i bedste fald 
accepteres i form af en svag hypotese der antager, at motoriske kommandoer 
omsaettes til abstrakte st0rrelser, vi kan anvende i identifikationen af 
sproglyde. 

’The Revised Motor Theory' (herefter 'Den reviderede Motorteori') er 
Liberman & Mattinglys (Liberman & Mattingly 1985) reaktion pa oven- 
stiende og andre problemer ved Motorteoriens staerke hypotese. For at 
svaekke kravet om testbare invariante motoriske kommandoer indf0rer 
Liberman & Mattingly en dybdestruktur bestaende af 'intenderede fonetiske 
gestus', hvilke de beskriver siledes: 

"...gestures have a virtue that the acoustic cues lack: Instances of a particular gesture always 
have certain topological properties not shared by any other gesture... gestures do have 
characteristic invariant properties, as the motor theory requires, though these must be seen, not 
as peripheral movements, but as the more remote structures that control the movements. These 
structures correspond to the speaker's intentions" (Liberman & Mattingly 1985: 23). 

Ud fra et rent teoretisk perspektiv er Den reviderede Motorteori en klar 
forbedring af Motorteorien, f0rst og fremmest fordi den nu kan opstille et 
generelt, helhedsskabende princip, den fonetiske gestus, der forener talens to 
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aspekter, produktion og perception. Med afsaet i en underliggende dybde- 
struktur, der afvikles i produktionssystemet og medierer i perceptions- 
processen, antages Den reviderede Motorteori at kunne integrere savel visuel 
og taktil som akustisk information. 

Motorteoriens svage hypotese er dog blevet anklaget for at vaere sa abstrakt 
og generel, at den ikke laengere kan forudsige noget om selve perceptions- 
processen^ Selvom Motorteorien tilbyder en uddybet begrebsliggprelse af 
perceptionsprocessen, kan den ikke beskrive de grundlaeggende rutiner i 
informationsprocesseringen, som lytteren gennemgar, nar det perciperede 
signal skal konverteres til invariante fonetiske gestus. Kort og godt tilbyder 
Motorteorien en begrebsliggprelse, men ingen mekanisme* *. 

Motorteorien i dens forskellige varianter er gennem tiden blevet udsat for 
meget hard kritik. De mest centrale punkter i kritikken er, (1) at Motor- 
teoriens forudsigelser ikke stemmer overens med en raekke vaegtige data; (2) 
at Motorteorien ikke kan tilbyde nogen reel Ipsning pa problemet om akustisk 
eller motorisk invarians; (3) at Motorteorien ikke kan give en beskrivelse af 
grundlaeggende rutiner i informationsprocesseringen - eller hvordan de 
tilegnes; og (4) at Motorteorien praesupponerer, at raekkefplgen i sprog- 
tilegnelse er produktion fprst og perception senere. Pa trods af al den kritik, 
danner Motorteorien alligevel grundlag for den made, mange ser pa sprog- 
perception, pa forholdet mellem det akustiske signal og segmenter, og pa 
fonembegrebet i eksperimentel fonetik. 

Analysis-by-Synthesis 

En anden teori, der inddrager den naere relation mellem perceptionen og 
mekanismer i taleproduktionen, er Analysis-by-Synthesis-teorien, som fprst 
og fremmest repraesenteres ved Kenneth N. Stevens og Morris Halle (Halle & 
Stevens 1959; Halle & Stevens 1972; Stevens 1960; Stevens & Halle 1967). 
Analysis-by-Synthesis-teorien blev udviklet parallelt med Motorteoriens 
tidlige faser (dvs. mens den endnu postulerede en staerk motorhypotese), men 
udg0r snarere et supplement end en total omskrivning af 'the Motor Theory 
of Speech Perception'. Man vil da ogsa finde de to teorier behandlet under 
samme overskrift i oversigtsvaerker om sprogperception og relaterede emner 

’ Dette implicerer uheldigvis, at teorien ikke laengere er falsificerbar. 

* Liberman (1970) har dog argumenteret for, at transformationen fra 1yd til fonem er en 
grammatisk transformation og derfor er en del af sprogbrugerens medf0dte lingvistiske 
kompetence (Cole 1977). 
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(se f.eks. Lieberman & Blumstein 1988: 147f; Borden & Harris 1984; Harley 
1995). 

Pa samme made som Motorteorien fastholder Analysis-by-Synthesis fonemet 
som perceptuel enhed uden samtidig at kraeve det realiseret i form af 
invariante akustiske traek. Analysis-by-Synthesis minder meget om Motor- 
teorien, da lytteren ogsk her formodes at referere til et saet neurologiske 
kommandoer, der bade indgir i perceptionen og produktionen af tale. Det er 
med andre ord igen de invariante motoriske kommandoer, der skal forbinde 
det akustiske signal med fonetiske segmenter. 

If0lge Analysis-by-Synthesis identificerer lytteren det akustiske signal ved at 
sammenligne det med en syntetiseret psykoakustisk skabelon, der konstrueres 
ved hjaelp af en model over taleorganeme og deres artikulatoriske dynamik. 
Som i andre synteseteorier, bl.a. Motorteorien, finder identifikations- 
processen sted ved en sammenligning mellem det egentlig perciperede signal 
og den syntetiserede replika. Hvis sammenligningens udfald er positivt, kan 
lytteren udlede motoriske kommandoer, der anvendes i segmental analyse, 
direkte fra den syntetiserede psykoakustiske skabelon. Hvis sammenligningens 
udfald derimod er negativt p^ grund af tilstraekkelig stor forskel mellem de to 
auditive m0nstre, justerer lytteren den artikulatoriske model, og dermed ogsk 
den hypotetiske skabelon, for endnu en gang at sammenligne med det 
perciperede signal (Lieberman & Blumstein 1988). 

Betegnelsen for denne perceptionsteori, Analysis-by-Synthesis, eller pk dansk 
'analyse ved syntese', giver altsd en ganske god ide om hovedtraekkene i 
perceptionsmodellen: Lytteren analyserer det akustiske signal ved sammen- 
ligning med en syntetiseret auditiv replika (Halle & Stevens 1959). 

Nu er det ikke sadan, at lytteren syntetiserer en psykoakustisk replika ud fra 
et tilfaeldighedsprincip totalt uafhaengig af det akustiske signal. Der er snarere 
tale om et 'kvalificeret gaet', som bygger pa en (spektral-)analyse af det 
neurale spektrogram, der udg0r det akustiske signals auditive manifestation. 
Det 'kvalificerede gaet', den hypotetiske replika, gennemgar herefter en trial- 
and-error-procedure, hvor lytteren fors0ger at matche replikaen med det 
perciperede signal. Det er vigtigt at pointere, at trial-and-error-proceduren er 
en n0dvendighed, hvis modellen skal give mulighed for at minimere forskelle 
mellem de sammenlignede st0rrelser. Et af de st0rste problemer ved 
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Motorteorien er netop, at sprogproduktion er en forudsaetning for sprog- 
perception; lytteren skal selv kunne producere en bestemt sproglyd for at 
kunne identificere den. Analysis-by-Synthesis er derimod en langt mere 
dynamisk model. Modellen bygger stadig pa en bottom-up-analyse, men 
analysen er blevet mere sofistikeret med en rekursiv trial-and-error- 
procedure. 

Det er en vigtig fordel ved Analysis-by-Synthesis, at modellen tager h0jde for 
bade inter- og intraindividuel variation. Den rekursive trial-and-error- 
procedure giver mulighed for, at de psykoakustiske hypoteser kan justeres, sa 
de tilpasses en lang raekke potentielle talehastigheder, toneh0jder, stemme- 
kvaliteter, udtalenormer, talehandikap, etc. Et ganske kort 0jebliks tale er 
tilstraekkeligt til, at lytteren kan justere hypotesen og den syntetiserede 
skabelon, sk den svarer til talerens saerlige taleproduktion. PI denne made kan 
alle vigtige fonetiske og fonologiske distinktioner pa det pagaeldende sprog 
fastholdes, samtidig med at analysen tillader netop de saerlige kvaliteter, der 
kendetegner en given taler pa et givet tidspunkt og sted. 

Ladefoged & Broadbent (1957) har i et fors0g vist i hvor stor udstraekning 
lytteren tilpasser identifikationsprocessen til talerens artikulatoriske 
karakteristika. En raekke fors0gspersoner blev praesenteret for en af seks 
versioner af en syntetisk fremstillet ytring, 'Please say what this word is’, 
efterfulgt af et af fire syntetisk fremstillede testord, [bit], [bit], [bet] og [baet]. 
Fors0gspersonemes opgave var sa at identificere testordet som et af de fire 
mulige. Den korte introduktionsytring, der udgjorde fors0gets varierende 
parameter, viste sig at have en signifikant indvirkning pi identifikationen af 
testordet. NIr den introducerende ytring blev praesenteret med en relativt h0j 
toneh0jde, identificerede fors0gspersoneme den f0rste stimulus som 'bit' i 87 
procent af tilfaeldene. NIr den samme introducerende ytring derimod blev 
praesenteret med en relativt lav toneh0jde, identificerede fors0gspersonerne 
nu pludselig den samme stimulus som 'bet' i 90 procent af tilfaeldene. 
Ladefoged & Broadbents resultater viser, at fors0gspersoneme anvender den 
introducerende ytring til at bestemme karakteristika ved "talerens" sprog- 
produktion, og at de justerer deres perception, si den tilpasses disse 
karakteristika. Resultateme af dette fors0g er med andre ord helt i overens- 
stemmelse med forudsigelser baseret pi Analysis-by-Synthesis. 
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Den absolut vigtigste pointe ved Analysis-by-Synthesis - set som teoretisk 
model - er, at den inddrager sprogsystemets mere globale egenskaber. For 
det f0rste foretages syntesen under hensyn til det pagaeldende sprogs fonetiske 
og fonologiske struktur. For det andet syntetiseres segmenter i forhold til 
ytringens suprasegmentale struktur. Dette er vigtigt, da analyser viser, at 
relationen mellem det akustiske og det fonetiske niveau varierer med 
trykforhold i stavelsen, intonationskonturen, samt stavelsens interne og 
eksteme struktur. Endelig kan det argumenteres, at Analysis-by-Synthesis ved 
lytterens rekursive analyse er underlagt det enkelte sprogs syntaktiske og 
semantiske restriktioner (Harley 1995; Borden & Harris 1984; Clark & Clark 
1977). 
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2.1 Introduktion til kategorisk perception 

Menneskets evne til at kategorisere er en absolut fundamental kognitiv 
egenskab. Vi er afhaengige af at kunne gruppere genstande, oplevelser, 
f0lelser etc. i en ellers kaotisk verden. Nar vi kategoriserer, fokuserer vi pa 
vigtige egenskaber, som forskellige objekter bar til faelles, og ignorerer alle 
irrelevante detaljer. 

Nogle af de kategorier, der danner grundlaget for vores oplevelse af verden, 
er naturlige kategorier; de afspejler fremtraedende fysiske forskelle mellem 
ting i omgivelseme og efterlader ingen tvivl om, hvad der er inkluderet i 
kategorien og hvad der ikke er\ Andre kategorier er langt mindre 
transparente og afspejler f0rst og fremmest kulturspecifikke konventioner. 
Hvad enten kategorierne er naturlige eller arbitraere, taenker vi sjaeldent pa 
dem som kategorier - og slet ikke pa det forhold, at de kun eksisterer i vores 
bevidsthed (Madsen 1996). 



Enhver form for kategorisering daekker over to typer adfaerd: den ene er 
diskrimi nation, det forhold, at vi opfatter A og B som forskellige; den anden 
er identifikation, det forhold, at vi oplever flere A'er som tilfaelde af samme 
'A (kategorien "A"). Diskriminationen har altsa at g0re med ens/forskellige- 
vurderinger, hvor identifikationen er en vurdering af, om et element tilh0rer 
en bestemt kategori eller ej. 



Typisk er vores evne til at diskriminere langt bedre end vores evne til at 
identificere. Alle, der har pr0vet at l0be t0r for vaegmaling ved, at det er 
svaert at identificere 'havbla' i den lokale malerforretning, men alt for let at 
se forskellen, nar man har malet de sidste to vaegge i stuen. Nar det vedr0rer 
perceptionen af sproglyde, er situationen en belt anden. Her viser gentagne 
fors0g, at man almindeligvis ikke kan skelne mellem flere sproglyde, end man 
kan identificere. Den kategoriske perception af sproglyde er enestaende, da 
man i perceptionen af ikke-sproglige lyde almindeligvis kan skelne mellem 
mange flere stimuli end man kan identificere^. 



‘ Hvorvidt naturlige kategorier overhovedet har nogen realitet er en gammel filosofisk 
diskussion, der igen er livet op i l0bet af 1980'eme (jf. f.eks. Lakoff 1987; Johnson 1987). 
Brent Berlin & Paul Kays (1969) opdagelse af, at sanseorganemes biologiske opbygning 
(receptoremes egenskaber) determinerer oplevelsen af prototypiske farver, viser, at ikke alle 
kategorier er arbitraere - men om man kan tale om naturlige kategorier, pnsker jeg ikke at 
diskutere naermere her, da det ikke har nogen relevans for denne underspgelse. 

^ Der er dog en raekke undtagelser, som jeg vil vende tilbage til senere. 
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Pet faenomen. at diskriminationen mellem akustisk ekvidifferente (lige 
forskellige) stimuli er ringe inden for den sproglige kategori (f.eks. *de lyde 
er alle [bV), men god mellem forskellige sproglige kategorier (f.eks. 'den 
forste var fbl, men den naeste var fpV) vil herefter blive betegnet *kategorisk 
perception* (forkortes *KP*1 : 

’’Perception is said to be categorical when subjects are able to discriminate among a set of 
stimuli only to the extent that they can assign different labels to them" (Studdert- Kennedy et al. 
1970). 

I nedenstaende hypotetiske fors0g med kategorisk perception praesenteres 
fors0gspersoner for en serie tilfaeldigt ordnede stimuli fra et kontinuum, 
f.eks. et [d]-[t]-kontinuum. Per er ofte tale om syntetisk genererede stimuli, 
der adskiller sig fra hinanden ved lige store skridt ad et akustisk kontinuum. 
Fors0gspersoneme^ bedes identificere de praesenterede stimuli, i dette 
eksempel som 'd’ eller *t’, hvorved det akustiske kontinuum inddeles i to 
kategorier, jf. figur 2.1.1. 



Idealmodel 




1 2 3 4 5 6 7 8 

T-D-kontlnuum 



Figur 2.1.1 Idealiserede identifikations- og diskriminationsfunktioner, der viser 
kategorisk perception af stimuli fra et [t]-[d]-kontinuum bestSende af 8 stimuli. 



^ Nogle steder i teksten vil ’fors0gspersoner’ vaere forkortet ’fp’ (isaer i modeller). Den 
varierende brug af hhv. den forkortede og den uforkortede form er ikke udtryk for forskellig 
reference, men udg0r alene stilistisk variation. 
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Dernaest praesenteres fors0gspersoneme for en tilfaeldigt ordnet serie stimuli i 
par. De skal nu vurdere, om de pagaeldende stimuli i hvert par er ens eller 
forskellige, altsa om de kan diskriminere mellem stimuli. 

Identifikations0velsen afsl0rer typisk en fonetisk graense her mellem 
stimulus 4 og 5. Stave Iser til venstre for denne graense tilskrives konsekvent 
kategori T, mens stavelser til h0jre for graensen identificeres som 
medlemmer af kategori 'D. Modellen forudsiger, at nar diskriminationsevnen 
testes, er den maksimal mellem de to kategorier T og 'D, hvorimod 
diskrimination mellem stimuli fra samme fonetiske kategori er tilfeldig, altsa 
omkring 50 procent. Selvom de akustiske forskelle mellem stimulus 1 og 2, 4 
og 5, 7 og 8 er de samme, er det ikke muligt at h0re, at der er tale om 
forskellige sproglyde i f0rste og sidste par, men relativt let at h0re forskellen 
mellem stimulus 4 og 5: 

"Other things being equal, stimuli belonging to the same phonetic category are more difficult to 
discriminate than stimuli on opposite sides of a phonetic boundary. This phenomenon has long 
been known as 'categorical perception'" (Studdert-Kennedy et al. 1970). 

Senere er man dog begyndt at skelne mellem det samlede faenomen 
'kategorisk perception"^ og den specifikke empiriske effekt, som fors0g med 
kategorisk perception ofte aff0der, nemlig en signifikant stigning i 
diskriminationen ved kategorigraenser (Repp 1982). Denne sidste effekt 
betegnes almindeligvis 'the phoneme boundary effect' (herefter 'den 
kategoriske effekt') og blev f0rst beskrevet indgaende af Wood i 1975. 

Som det fremgar af ovenstaende, vedr0rer forskning i KP de fonetiske 
segmenters perceptuelle realitet, dvs. fonetiske kategoriers funktion i 
perception sprocessen uafhaengigt af, om sprogbrugeren er bevidst om 
kategoriernes realitet. Selvom KP oprindeligt begyndte som et meget snasvert 
forskningsomrade, er det med tiden blevet en betegnelse for et relativt bredt 
forskningsparadigme med veldefinerede empiriske modeller. I det f0lgende er 
det min hensigt at give et historisk og metodisk overblik over netop dette 
paradigme. 



* Kategorisk perception daekker over et faenomen, der inkluderer skarpe kategorigraenser, 
reduceret kontekstsensibilitet, forudsigelig diskriminationsadfaerd pa baggrund af 
identifikationsscoren o.a. (Studdert-Kennedy, Liberman, Harris & Cooper 1970). Den 
teoretiske model vil blive beskrevet naermere i det fplgende. 
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Kategorisk perception - en historisk og metodisk oversigt 

Den tidlige forskning i KP udvikledes ved Haskins-Laboratorieme i New 
Haven, Connecticut, i takt med brugen af talesynthesizere - ogsa kaldet 
'Pattern Playback’^ Liberman, Harris, Hoffman og Griffith (1957) skulle 
blive de f0rste til at beskrive det faenomen, som senere er blevet kendt under 
betegnelsen 'Kategorisk perception’. Ved hjaelp af en Pattern Playback- 
synthesizer havde de konstrueret et fysisk kontinuum af CV-stavelser, der 
daekkede de tre kategorier [ba], [da] og [ga]. Selvom disse syntetiske stimuli 
udgjorde et akustisk kontinuum - fremkaldt ved en gradvis forh0jelse af F2’s 
begyndelsesfrekvens (jf. figur 2.1.2) - grupperede fors0gspersoneme dem i 
tre skarpt adskilte kategorier. 
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Figur 2.1.2 Akustisk kontinuum besttode af 14 syntetiske stimuli med varierende F2. 1 
en identifikationstest blev de 14 formantpar kategoriseret som hhv. [ba], [da] og [ga]. 

(Fra Liberman et al. 1957:359) 





For at unders0ge om de ekvidifferente fysiske forskelle mellem stimuli fra 
samme kategori kunne opfanges af fors0gspersoneme, antog Liberman et al. 
en ABX-diskriminationstest. I denne test skal fors0gspersoneme afg0re, om 
den sidste af tre konsekutive stimuli er identisk med den f0rste eller anden, 
der altid er forskellige. Resultateme af testen viste, at stimuli, der tidligere 
var blevet identificeret som tilh0rende forskellige sproglige kategorier, var 



^ Pattern Playback-talesynthesizeren er resultatet af en forskningsorienteret videreudvikling af 
den foromtdte Vocoder-synthesizer, der oprindeligt blev udviklet ved Bell Telephone 
Laboratorieme i slutningen af 1930’eme. 
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lette at diskriminere, hvorimod stimuli, der tidligere var blevet identificeret 
som tilh0rende samme sproglige kategori, var meget svaere at diskriminere. 
Da det akustiske kontinuum bestod af ekvidifferente stimuli, der var sammen- 
lignelige, kunne resultateme kun tilskrives perceptionsprocessen. 

Med afsaet i en antagelse om, at lyttere ikke bar information ud over den 
fonologiske kategori^ kunne Liberman et al. (1957) opstille en forudsigelse 
om fors0gspersoners diskriminationsevne determ ineret af deres adfaerd i 
identifikationstesten. Imidlertid viste diskriminationstesten, at fors0gs- 
personeme havde lettere ved at h0re forskel mellem (bade inter- og intra- 
kategoriale) stimuli end forventet, hvilket kan tolkes derhen, at lyttere 
benytter sig af yderligere information om stimulus. 

OvenstSende fors0g rejste en raekke centrale sp0rgsmal om perceptionen af 
sproglyde og aff0dte et belt nyt forskningsparadigme. Med Liberman et al. 
(1957) blev der sat standard for en raekke lignende unders0gelser med 
forskellige fonetiske kontraster. F.eks. rapporterede Liberman, Harris, 
Kinney & Lane (1961) kategorisk perception af [d] versus [t] kontrast ved ‘FI 
cutback'^; Liberman, Harris, Eimas, Lisker & Bastian (1961) fandt lignende 
resultater med intervokalisk [b] versus [p] kontrast ved varierende ’silent 
interval’; Bastian, Eimas & Liberman (1961) demonstrerede, at artikulatorisk 
lukke signaleret ved silent interval (f.eks. [slit] versus [split]) ligeledes blev 
perciperet kategorisk. 

Disse fors0g star i kontrast til fors0g udf0rt af bl.a. Fry, Abramson, Eimas & 
Liberman (1962) og Eimas (1963), der viser, at syntetiske vokaler i et [I]-[e]- 
[ae]-kontinuum diskrimineres lige godt i og mellem fonetiske kategorier - et 
faenomen, der almindeligvis betegnes 'kontinuerlig perception'. Kontinuerlig 
perception er ogsS blevet fremkaldt med andre akustiske kontinua, f.eks. 
vokallaengde (Bastian & Abramson 1964) og intonationskonturer (Abramson 
1961), samt med ikke-sproglige stimuli, der bar traek til faelles med 



* Denne antagelse udspringer af Motorteoriens hypotese om, at det akustiske signal og 
fonetiske segmenter i bade perception og produktion medieres af motoriske kommandoer (jf. 
side 22). 

’ 'FI -cutback’ var den f0rste teknik, der blev anvendt til at skabe et stemthedskontinuum. 
Teknikken bestir i en gradvis forsinkelse af FI's onset i forhold til de andre (0vre) formanters 
onset. 'FI -cutback' er senere blevet afl0st af en anden teknik, hvor en forsinkelse af FI's 
onset kombineres med en substitution af aperiodisk med periodisk energi i de 0vre formanter 
under forsinkelsesperioden. Den sidstnaevnte teknik blev udviklet af Abramson & Lisker i 
l0bet af 1970 (Abramson & Lisker 1970; Lisker & Abramson 1970). 
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kategorisk perciperede sproglige stimuli (f.eks. Liberman, Harris, Eimas, 
Lisker & Bastian 1961; Liberman, Harris, Kinney & Lane 1961). Med andre 
ord synes KP udelukkende at vedr0re sproglige stimuli - med undtagelse af 
isolerede vokallyde - og isaer klusiler. 

Resultateme fra disse tidlige unders0gelser af KP havde stor indflydelse pa 
udviklingen af perceptionsteorier i l0bet af 1950’erne og 1960'erne, isaer 
synteseteorieme, hvoraf Motorteorien er den mest kendte (jf. side 20f0^ Det 
essentielle ved synteseteorieme er, at de bygger pa en hypotese om, at sprog- 
perception og -artikulation bygger pi samme (eller naert forbundne) 
neurologiske processer, dvs. at sprogbrugere traekker pi €t saet neurologiske 
kommandoer, der bide indgir i perceptionen og produktionen af tale. Nir 
forskellige fonetiske kategorier (f.eks. [t]-[d]) adskiller sig fra hinanden ved 
diskrete artikulatoriske egenskaber (f.eks. artikulationssted (F2) eller 
artikulationsmlde (VOT^)), vil et akustisk kontinuum, der straekker sig over 
flere af disse kategorier, blive perciperet kategorisk. Derimod vil 
perceptionen vaere kontinuerlig, nIr kontinuerlig artikulatorisk variation 
mellem fonetiske kategorier er mulig (som f.eks. ved [i]-[e]-[ae]-[a]). Bide 
Analysis-by-Synthesis og Motorteorien tager altsi KP som en direkte 
afspejling af den artikulatoriske organiser! ng. 

Bortset fra et enkelt kritisk indlaeg af Harlan Lane i 1965 (Lane 1965) var 
forskningen i KP i 1950'erne og 1960'eme udelukkende forbundet med 
gruppen af forskere ansat ved Haskins-Laboratorieme - og havde 
udelukkende Motorteorien som teoretiske indgangsvinkel. 

Harlan Lane og bans kollegaer ved Michigan Universitet studerede KP ud fra 
et psykofysisk perspektiv og fors0gte at pivise, at den kategoriske effekt ogsl 
kan fremkaldes ved hjaelp af ikke-sproglige stimuli under sammenlignelige 
eksperimentelle forhold. Resultatet af en raekke fors0g blev samlet i et 
kraftigt udfald mod isaer forskningen i KP pi Haskins-Laboratorieme, men 



* De fleste fors0g med KP blev udf0rt pi Haskins-Laboratorieme, der samtidig var centrum i 
udviklingen af Motorteorien. Der er ingen tvivl om, at opdagelsen af den kategoriske effekt 
virkede forstaerkende pi denne udvikling. Den primaere Irsag til at der ikke blev udfprt flere 
fors0g med KP andre steder end pi Haskins-Laboratorieme er simpelthen, at man pi dette 
tidspunkt kun havde adgang til de nye forskningsorienterede talesynthesizere ganske fl steder. 

® VOX (forkortelse af Voice Onset Time) udg0r her den tidslige afstand mellem en 
stavelsesinitiale konsonants eksplosion og stemthedens pibegyndelse. VOT daekker med andre 
ord eksplosionen og aspirationen. leg er klar over, at VOT kan miles fra implosionen, men 
dette ville ikke give information om eksplosionen og aspirationens varighed (Springer 1980). 
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ogsa mere generelt de nye synteseteorier (Lane 1965). Der er nok ingen tvivl 
om, at kritikken i Lanes indlaeg foregreb nogle af de alternative forklaringer 
pa KP, der er blevet praesenteret fra midten af l970'eme og frem til i dag. 
Lanes indlaeg fik dog en relativt ringe indflydelse pa samtidens forskning i 
KP, hvilket f0rst og fremmest skyldtes et svagt empirisk fundament. Faktisk 
blev Lanes indlaeg totalt ignoreret indtil 1970, hvor Haskins-gruppen, 
repraesenteret ved Studdert-Kennedy, Liberman, Harris og Cooper, tog 
kraftigt til genmaele (Studdert-Kennedy et al. 1970). 

Forskningen i KP fortsatte pa Haskins-Laboratorieme op gennem 1960'erne, 
bl.a. med Abramson & Lisker (1970), der paviste kategorisk perception af 
stemte versus ustemte lukkelyde (f.eks. [ba]-[pa]) i VOT-kontinua. 
Fors0gspersoner, der havde thai som modersmal, havde 6n stemthedsgraense 
(eller VOT-graense) og fors0gspersoner med engelsk som modersmal en 
anden. En anden tidlig komparativ unders0gelse blev udf0rt af Stevens, 
Liberman, Ohman & Studdert-Kennedy (1969) med engelske og svenske 
vokallyde. Selvom resultatet af denne test ikke viste samme grad af 
kontinuerlig perception som f0romtalte unders0gelse af Fry et al. (1962, jf. 
side 35), var der ingen korrelation mellem identifikation og diskrimi nation, 
hvilket udelukker kategorisk perception. Endelig blev de tidlige fors0g med 
kategorisk perception af f.eks. de stemte lukkelyde [ba]-[da]-[ga] (Liberman et 
al. 1957) reproduceret i en serie nye unders0gelser, bl.a. en unders0gelse 
udf0rt af Mattingly, Liberman, Syrdal & Halwes (1971), der som de f0rste 
inddrog lukkelyde i final position samt en raekke ikke-sproglige kontrol- 
stimuli, der ikke blev perciperet kategorisk. 

Det var dog ikke kun vokal- og lukkelyde, der blev anvendt i fors0g med KP. 
EfterhSnden som talesynthesizeme blev lettere tilgaengelige og syntese- 
teknikkeme mere sofistikerede, blev ogsS andre fonetiske kate gorier 
udforsket. F.eks. blev der afsl0ret en del vis kategorisk perception af affrikat- 
frikativ distinktionen (Cutting & Rosner 1974), af likvid-kontinua (McGovern 
& Strange 1977; Miyawaki, Strange, Verbrugge, Liberman, Jenkins & 
Fujimura 1975), af nasalkonsonanter (Larkey, Wald & Strange 1978; Miller 
& Eimas 1977) og af oral-nasal distinktionen (Miller & Eimas 1977). 
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Informationsprocessering og *the dual-process model' 

Umiddelbart virkede det som om al forskning i KP i 1950erne og 1960 erne 
foregik pa Haskins-Laboratorierne. Dette viste sig ikke at vaere tilfaeldet. I 
arene 1968-1971 havde to japanske forskere, Fujisaki og Kawashima, 
beskaeftiget sig med KP som informationsprocessering - et arbejde, der var 
aldeles ukendt for vestlige forskere, indtil Pisoni (1971, 1973, 1975) 
diskuterede og perspektiverede det. 

Med Fujisaki og Kawashima blev fokus nu flyttet fra kategorisk perception 
som faenomen til kategorisk perception som en perceptionsproces ^^ Fujisaki 
& Kawashima (1969, 1970, 1971) formulerede, hvad de betegnede som en 
’dual-process model’ for diskrimination af sproglyde. Modellen skelner 
eksplicit mellem kategorisk fonemisk perception og auditiv perception, der 
er knyttet til en (prae-)auditiv buffer, der kan fastholde akustiske traek". 
Hensigten med modellen er at redeg0re for de observerbare afvigelser fra den 
idealiserede Haskins-model - at diskriminationsadfaerden i konkrete fors0g er 
bedre end forventet. 

Fujisaki og Kawashima anvendte endvidere nye serier af sproglyde, bl.a. 
syntetiske frikativer, semivokaler og likvider, og viste, at disse perciperes 
mindre kategorisk end klusiler, men heller ikke kontinuerligt som isolerede 
vokallyde. Endelig eksperimenterede Fujisaki og Kawashima med vokallyde 
af varierende laengde og med varierende kontekst, hvilket viste, at selv 
vokaler kan perciperes relativt kategorisk, hvis fors0gsopstillingen er 
ugunstig for den auditive hukommelse. 

Pisoni (1971, 1972, 1973, 1975, Pisoni & Lazarus 1974) afpr0vede og 
udvidede Fujisaki og Kawashimas 'dual-process model' ved en raekke fors0g, 
der bl.a. afsl0rede, at graden af kontinuitet i perceptionen af sproglyde i h0j 
grad afhaenger af, om lytteren er i stand til at anvende den auditive 
hukommelse. Pisoni cementerede yderligere denne opdagelse i fors0g med 
varierende stimuluslaengde, varierende pause mellem stimuluspraesentationer 
og ved introduktion af distraktionslyde mellem stimuli, der skulle 

Dette medf0rte bl.a. en st0rre interesse for forskellige fors0gsvariabler, f.eks. 
stimulusvariabler. 

Den auditive buffer/hukommelse - ogsS kendt som 'Preperceptual Auditory Storage' - er en 
mekanisme, der er blevet beskrevet indgaende af psykologer og lingvister, bl.a. Massaro 
(1970, 1971, 1972), Massaro & Oden (1980), Oden & Massaro (1978), Pisoni (1971, 1972, 
1973, 1975), Wood (1975), etc. PS det neurale niveau bestSr den auditive buffer af 
ganglieceller i nervus acusticus (i det cortiske organ). 
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diskrimineres. Et fors0g med reaktionstid som indikator for fors0gspersoners 
(interfonemiske) diskriminationsevne (Pisoni & Tash 1974) satte ligefrem 
gang i en stigende interesse for fors0gspersoners evne til suhfonemisk 
diskrimination af akustiske forskelle^^. Saledes aendrede forskningen i KP i 
l0bet af fa ar karakter fra udelukkende at skabe fundament for en synteseteori 
til ogsa at rejse en raekke sp0rgsmSl inden for en psykoakustisk og psyko- 
fysisk beskrivelsesramme. 

Kategorisk perception \ et nyt perspektiv 

I l0bet af 1970'eme udspaltedes en raekke nye semi-uafhaengige forsknings- 
paradigmer fra den traditionelle forskning i KP. Et af de nye projekter var 
udforskningen af spaedb0ms sprogperception (for en oversigt se Eimas 1975b 
og Morse 1978). Det eksperimentelle paradigme adskiller sig ikke vaesentligt 
fra fors0g med voksne fors0gspersoner, bortset fra responsprocedurerne 
High- Amplitude Sucking og Heart Rate‘\ 

I en af de f0rste og mest ber0mte unders0gelser af spaedb0ms sprog- 
perception anvendte Eimas, Siqueland, Jusczyk & Vigorito (1971) HAS- 
proceduren*'* for at beskrive 1 og 4 maneder gamle spaedb0ms perception af 
CV-stavelser ([ba]-[pa]) fra et VOT-kontinuum. 



I en test med intrakategorial stimulus-skifte blev spaedb0mene f0rst 
praesenteret for 6n stavelse - enten med +20 ms eller +40 ms VOT - 
hvorefter der skiftedes til den anden efter en tilvaenningsperiode^^. En 
tilsvarende procedure blev anvendt ved interkategorial stimulus-skifte, hvor 
spaedb0mene blev praesenteret for forskellige stimuli fra samme kategori: -20 



Mens forskningen i KP udelukkende fandt sted pi Haskins-Laboratorieme, der var centrum 
i udviklingen af Motorteorien, blev enhver tale om subfonemisk diskrimination - af gode 
grunde - belt undgiet, medmindre diskriminationsprocenten var stor nok til at det kunne 
karakteriseres som 'kontinuerlig perception’ (af f.eks. vokallyde) (Repp 1 984). 

High-Amplitude Sucking og Heart Rate forkortes hhv. HAS og HR. Se Morse 1974 for en 
diskussion om de to teknikker. 

Med HAS-proceduren er praesentationen af en sproglig stimulus betinget af, hvor hurtigt 
spaedbamet sutter pa en elektronisk trykfplsom narresut: Ved praesentationen af en ny stimulus 
stiger suttehastigheden fra et ellers stabilt niveau, indtil lyden mister sin ’’nyhedsvaerdi” og 
suttehastigheden atter falder til det stabile niveau. En stigning i suttehastighed umiddelbart efter 
praesentationen af en ny stimulus tolkes i dette paradigme som konsekvens af bamets evne til 
at skelne mellem to stimuli, den nye og den gamle. Eimas (1975b) har dog pointeret, at en 
praesentationsprocedure som HAS (og HR) bestemt ikke er uproblematisk: der kan vaere god 
grund til at antage, at selve proceduren fremkalder en stimulusadaption (se diskussion af 
’selective adaptation’ side 44 her). 

Denne praesentation er intrafonemisk, da den fonetiske [b]-[p]-kategorigraense pa engelsk er 
omkring +25 ms VOT (Springer 1979). 
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ms VOX og 0 ms VOX, der begge var blevet identificeret som [ba] af voksne 
fors0gspersoner, eller +60 ms VOX og +80 ms VOX, der begge var blevet 
identificeret som [pa], ligeledes af voksne fors0gspersoner. En kontrolgruppe 
spaedb0m blev udelukkende praesenteret for en af de 6 CV-stavelser og havde 
ingen signifikant uregelmaessig suttehastighed. 

Resultateme viste, at spaedb0m, der var blevet praesenteret for interkategorial 
stimulus-skifte, havde reageret ved en lille stigning i suttehastighed, hvorimod 
spaedb0m, der var blevet praesenteret for intrakategorial stimulus-skifte, 
udviste en adfaerd parallel med kontrolgruppen. Eimas et al. (1971) tolkede 
disse resultater som et udslag af spaedb0ms evne til kategorisk perception 
svarende til voksnes: spaedb0m er i stand til at diskriminere mellem 
forskellige stimuli fra forskellige sproglige kategorier, men ikke akustisk 
forskellige stimuli fra samme kategori (i det mindste ikke i sadan en grad, at 
det pavirker suttehastigheden). Netop dette fors0g er blevet udvidet til ogsa at 
daekke andre sproglige kontinua, almindeligvis med resultater svarende til 
ovenstaende (Eimas 1974a, 1974b, 1975a). 



+ 60 and +aO VOT 

+ 20aod+40vOT —20 and O VOT 
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Figur 2.1.3 Gennemsnitlig suttehastighed hos 4 m^neder gamle spaedb0m i 3 forskellige 
fors0gsopstillinger. 'B' repraesenterer det stabile niveau f0r praesentationen af en stimulus. 
Hvert diagram viser suttehastigheden som fiinktion af tid. Den stiplede linje registrerer 
stimulusskifte bortset fra i diagrammet laengst til h0jre, hvor den markerer det tidspunkt, 
hvor der ville have vaeret stimulusskifte. Stimuli i venstre diagram daekker over et [b]-[p]- 
kontinuum, som det opleves af voksne fors0gspersoner, hvorimod kontrasterede stimuli i 
det midterste diagram er fra samme kategori. (Fra Borden & Harris 1984:202 - tilpasset fra 
Eimas, Siqueland, Juszyck & Vigorito 1971 : 304). 
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Resultateme fra fors0g med KP hos spaedb0rn er ofte blevet anvendt som 
argument for en medf0dt sprogkompetence. Om KP hos spaedb0m skyldes 
medf0dt kompetence eller tidlig sprogtilegnelse, skal efter min vurdering 
unders0ges ved komparative studier af den lingvistiske erfarings betydning 
for spaedb0ms perception af sproglyde (Lasky, Syrdal-Lasky & Klein 1975; 
Streeter 1976). De fors0g, der er foretaget inden for dette omrade, er dog 
temmelig tvetydige og rejser snarere flere (metodiske) sp0rgsmal, end de 
besvarer. Et eksempel er Streeter (1976), som arbejdede i Kenya med 
spaedb0m, hvis foraeldre take kikuyu - et bantusprog med kun en bilabial 
lukkelyd, et praestemt [b] med (i gennemsnit) -64 ms VOX. Efter at have 
gennemf0rt en diskriminationstest med et VOT-kontinuum og samme HAS- 
procedure som i Eimas et al. (1971), haevdede hun, at kikuyu-spaedb0m ikke 
alene kan diskriminere den relevante kontrast for deres modersmal, men ogsa 
den relevante kontrast for engelsk - en kontrast, der vel at maerke ikke 
optraeder i kikuyu. Dette resultat stemmer overraskende (?) godt overens med 
Eimas (1975b), der antyder, at amerikanske spaedb0m kan diskriminere 
stimulus-skifte over praestemt-stemt-kategorigraensen, som den manifesteres 
pa kikuyu, men ikke kategorisk som med den engelske stemte-ustemte [b]-[p]- 
kontrast. Morse (1978) har dog konstateret - efter en n0jere analyse af 
Streeters resultater - at der simpelthen ikke er evidens i hendes data for en 
sadan pastand om kikuyu-spaedb0ms kategoriske perception af den engelske 
[b)-[p)-kontrast (Springer 1979). 

Et andet nyt forskningsprojekt, der udvikledes i l0bet af 1970'eme, var 
udforskningen af KP hos forskellige dyrearter. Dette projekt var en naturlig 
konsekvens af synteseteoriemes hypotese om en (artsspecifik) sprogspecifik 
perceptionsmodus: Antagelsen om, at sprogproduktion og sprogperception 
bygger pS de samme neurologiske kommandoer, forudsaetter, at det ikke er 
muligt at finde KP hos dyr, da de ikke evner at producere tale (Liberman 
1974). 

Pa trods af et relativt lille antal er fors0g med KP hos dyr virkelig kommet i 
fokus. Nogle af de mest kendte er Kuhl & Miller (1975, 1978); Kuhl (1976); 
Morse & Snowdon (1975); Sinnott, Beecher, Moody & Stebbins (1976); 
Waters & Wilson 1976. 
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Ved hjaelp af en HR-procedure^^ til registrering af diskriminationen fandt 
Morse 8l Snowdon (1975) bade intra- og interkategorial diskrimination hos 
rhesusaber, dog med en ringere diskrimination af forskellige stimuli fra 
samme kategori. Desuden kunne Miller 8c Morse (1976) rapportere en bedre 
intrakategorial diskrimination hos rhesusaber end hos 3 maneder gamle spaed- 
b0m. Ogsa i denne komparative unders0gelse var den interkategoriale 
diskrimination betydelig bedre end den intrakategoriale. 

Kuhl og Millers (Kuhl 8l Miller 1975; Kuhl 1976) ber0mte fors0g med 
chinchillaer (en lille sydamerikansk gnaver), som blev traenet i kategori serin g 
af et VOT-kontinuum^^ viser en VOT-kategorigraense ved 33,5 ms VOT 
- meget taet pa den (engelske) fonetiske kategorigraense ved 35,2 ms VOT, 
som fors0g med voksne fors0gs-personer afsl0rer. Kuhl & Miller 
konkluderer pi linje med mange andre forskere inden for dette omrade: Da 
det ikke er sandsynligt, at disse resultater skyldes en sprogspecifik fonetisk 
processering hos chinchillaer, mi irsagen findes i chinchillaens (og 
menneskets) auditive psykofysiske indretning (se Springer 1979 for diskussion 
af denne forklaringsmodel). 

Det er efter min mening tvivlsomt, om denne konklusion er rimelig. For det 
f0rste blev Kuhl og Millers chinchillaer trsenet i CV-identifikation, hvilket 
leder tanken hen mod den klassiske betingningsmetode, kendt fra bl.a. den 
tidlige adfaerdspsykologi omkring irhundredeskiftet. For det andet afsl0rer en 
isoleret identifikationstest ikke, om der er tale om KP: Selv i kontinuerlig 
perception af et vokal-kontinuum er vi i stand til at identificere de enkelte 
vokallyde. Derimod er den kategoriske effekt i en diskriminations0velse en 
ganske god indikator for, om vi opfatter de praesenterede stimuli som diskrete 
st0rrelser. 

Generelt mener jeg, at der er god grund til at forholde sig kritisk til fors0g 
med KP, der alene baseres pi 'evoked potentials’ (f.eks. ved hjaelp af en HAS- 



HR-proceduren minder meget om den f0romtalte HAS-procedure (jf. note 14). Med HR- 
proceduren er praesentationen af en sproglig stimulus betinget af respondentens hjerteslag, 
hvadenten respondenten er et dyr, et spaedbam eller et voksent menneske: Ved praesentationen 
af en ny stimulus stiger antallet af hjerteslag, hvorefter det falder til normalniveauet i l0bet af 
en tilvaenningsperiode. En stigning i antallet af hjerteslag lige efter praesentationen af en ny 
stimulus tolkes her som en konsekvens af respondentens evne til at skelne mellem to stimuli. 

Der er tale om et akustisk kontinuum svarende til det, der blev anvendt i Eimas, Siqueland, 
Jusczyk & Vigoritos (1971) fors0g med spaedb0m, bortset fra at der her blev anvendt stemte- 
ustemte bilabiale lukkelyde og ikke stemte-ustemte alveolaere lukkelyde. 
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eller HR-procedure), dvs. fors0gsparadigmer, der ofte anvendes i fors0g med 
spaedb0m og dyr. Resultater fremkaldt ved subliminal perception er simpelt- 
hen ikke relevante i beskrivelsen af sprogperception; Om en fors0gspersons 
hjerteslag aendres ved praesentationen af en ny stimulus er absolut irrelevant i 
et fors0g med KP, hvis det ikke pa anden vis kan dokumenteres, at 
fors0gspersonen h0rer forskel. Nar jeg alligevel har valgt at inddrage og 
beskrive en raekke fors0g, hvis metodologi og analysekoncept er kritisabelt, 
skyldes det, at deres konklusioner har haft en forholdsvis stor indflydelse pi 
udviklingen af teorier inden for KP, perceptionspsykologi, neurolingvistik, 
psykolingvistik og andre relaterede omrader. 

Kategorisk perception i et psykoakustisk perspektiv 
Den tidlige forskning i KP, centreret omkring Haskins-gruppen, var naet 
frem til den konklusion, at KP er specifik for sproglyde - f0rst og fremmest 
lukkelydene [p], [t], [k], [b], [d] og [g]. Lanes (1965) fors0g pa at forklare KP 
ud fra generelle auditive processer havde ikke haft den n0dvendige 
gennemslagskraft og fremstod derfor naesten upaagtet indtil midten af 
1970’eme, hvor den psykoakustiske forklaringsmodel blev "genopdaget”. 

Haskins-gruppens tidlige konklusioner vedr0rende KP viste sig ikke at vaere 
holdbare, da forskere begyndte at melde om KP af ikke-sproglige stimuli. 
Cutting & Rosner (1974) haevdede, at de havde registreret kategorisk 
perception af komplekse, periodiske toner fra et sakaldte ’pluck-bow' 
kontinuum*®. Miller, Wier, Pastore, Kelly & Dooling (1976) rapporterede om 
kategorisk perception af summelyde, der skulle aekvivalere et VOT- 
kontinuum. Pisoni (1977) fik et lignende resultat med periodiske toner, der 
varierede mht. relativ onset time. 

Som en konsekvens af ovenstaende unders0gelser begyndte flere og flere at 
opbygge teoretiske psykoakustiske modeller, der kunne integrere resultateme 
fra fors0g med KP: Macmillan, Kaplan & Creelman (1977) fors0gte at 
beskrive KP ud fra en signal-detektor-teori; Pastore (1981) studerede de 
psykoakustiske faktorer, der kan have indvirkning pa KP; og Schouten (1980, 
1987), der antog en auditiv 'threshold model', gik sa langt som til at haevde, at 



** Ved hjaelp af en Moog-synthesizer genererede Cutting og Rosner et kontinuum af sav- 
takkede lydsvingninger af en varighed pi 1000 ms. Stimuli varierede mht. stigningstidspunkt 
fra 0 til 80 ms i konsekutive skridt a 10 ms. I en identifikationstest blev de fprste 3 stimuli 
identificeret som 'knipset' og de sidste 5 som 'str0get' (musikterminologi lint fra 
strygerinstrumenter som f.eks. violin). 
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sprogperception i det hele taget kunne forklares ved psykoakustiske 
principper. Faellesnaevneren for disse psykoakustiske tilgange er en antagelse 
om, at lingvistiske kategorier grundlaeggende er psykoakustisk determineret 
(Miller, Wier, Pastore, Kelly & Dooling 1976). Dette synspunkt er i l0bet af 
de sidste dekader blevet et reelt altemativ til Fujisaki og Kawashimas 'dual- 
process model' (beskrevet side 38f). Endvidere er kontroverseme mellem de 
to tilgange hyppigere og hyppigere blevet forbundet med den gamle debat 
om, hvorvidt det er n0dvendigt at antage eksistensen af en speciel sprog- 
processor, hvilket haevdes af synteseteoretikeme. 

En made at overfl0digg0re den fonetiske sprogprocessor er at foresla en 
empirisk model, der kan redeg0re for KP ved hjaelp af andre teknikker end 
en decideret fonetisk analyse. Hvis denne model endvidere kan redeg0re for 
andre faenomener, som f.eks. 'dual-process modellen' ikke kan tilgodese, ma 
den anses for at vaere teoretisk mere robust. Netop denne strategi dannede 
fundamentet for et forskningsparadigme, 'selective adaptation’ der ligeledes 
blev udspaltet fra KP i l0bet af 1970'eme - men senere skulle vise sig at vaere 
en metodisk blindgyde. 

Man var i l0bet af 1970'eme begyndt at overveje den mulighed, at detektorer 
til identifikation af fonetiske traek var en fundamental mekanisme i perception 
af sprog (Ades 1976; Studdert-Kennedy 1974)*®. Eimas & Corbit (1973) var 
de f0rste til at teste en hypotese, der udsprang af en 'traek-detektor-model*. 
De postulerede, at VOT-sensitive traek-detektorer var arsagen til stemt-ustemt 
kontrasten (f.eks. [b]-[p]): en gruppe detektorer reagerer pa lav VOT og en 
anden pa h0j VOT. Med andre ord ville en stimulus blive identificeret som et 
stemt fonem, hvis stimulationen af detektorer, der reagerer pa lave VOT- 
vaerdier, oversteg stimulationen af VOT-detektorer med en h0j reaktions- 
taerskel - og i modsat fald ville stimulus blive identificeret som et ustemt 
fonem. Stemt-ustemt kategorigraensen korresponderer if0lge modellen med 
den VOT-vaerdi, der virker som lige kraftigt irritament for begge grupper af 
VOT-detektorer (jf figur 2.1.4 - A). 

Eimas & Corbit (1973) anvendte en teknik, ’selective adaptation', der gar ud 
pa at overstimulere (dvs. traette) den ene af de to grupper VOT-detektorer 

Den grundlaeggende tanke, at fonemer kan beskrives ved en traekanalyse (feature analysis), 
varbestemt ikke ny (jf. f.eks. Jakobson, Fant & Halle 1963; Halle 19^; Chomsky & Halle 
1968) - det var derimod fors0get pS at implementere traekanalysen i en empirisk 
perceptionsmodel. 
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ved gentagne gange at praesentere stimuli fra enten den ene eller den anden 
ende af et VOT-kontinuum. Herefter skal fors0gspersoneme identificere 
stimuli fra den resterende del af det akustiske kontinuum^^. I en sammen- 
ligning af identifikationsfunktioneme hhv. f0r og efter ’selective adaptation' 
fremstar det tydeligt, at den fonetiske kategorigraense er blevet manipuleret: 
efter en gentagen praesentation af f.eks. en -10 ms VOT-stimulus er kategori- 
graensen blevet rykket mod den stemte ende af det akustiske kontinuum, dvs. 
at fors0gspersoneme bar kategoriseret faerre stimuli som stemte end i den 
tilsvarende praesentation uden ’selective adaptation’ (jf. figur 2.1.4 - B). Og 
akkurat det samme g0r sig gaeldende i diskriminationstesten: diskriminations- 
toppen er rykket vaek fra den ende af det akustiske kontinuum, der 
korresponderer med de overstimulerede VOT-detektorer. Resultatet af 
fors0get med ’selective adaptation’ svarer fuldstaendig til det forventede if0lge 
’traek-detektor-modellen’. 




Boundary 

shift 




Figur 2.1.4 Hypotetiske sensitivitetsfunktioner for VOT-detektorer, der varetager distink- 
tionen mellem f.eks. [b]-[p]. A: Fpr adaption. B: Efter adaption med gentagne praesenta- 
tioner af stimulus. (Fra Foss & Hakes 1978: 91, fig. 3). 



Eimas & Corbits (1973) fors0g med ’selective adaptation' er sidenhen blevet 
gentaget med andre VOT-kontinua (Eimas, Cooper & Corbits 1973; Cooper 
1974c). Endvidere er fors0gsrepertoiret blevet udvidet til ogsa at indbefatte 



Den gentagene praesentation af stimuli fra en ende af et VOT-kontinuum skete ved en 
hyppighed af 2 stimuli per sekund i blokke h 6i minuts varighed. 
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fors0g med stimuli, der varierer mht. artikulationssted (Cooper 1974a, 
1974b; Ades 1974). 

Umiddelbart skulle man nu tro, at sagen var afklaret: ’traek-detektor-modellen 
kan bade forklare KP samt forudsige resultatet af fors0g med ’selective 
adaptation’. Imidlertid bar det senere vist sig, at adaptionseffekten ikke finder 
sted pi et fonetisk niveau, der kan forbindes med ’traek-detektorer’, men er et 
rent auditivt faenomen, der ogsa kan fremkaldes med ikke-sproglige stimuli 
(Ades 1974, eksperiment 1; Roberts & Summerfield 1981; Sawusch & 
Jusczyk 1981)^^ 

Resultatet af fors0g med ’selective adaptation’ er et velkendt faenomen i 
fors0g med nerveceller - uanset hvor de Andes i kroppen og uanset om 
kroppen tilh0rer et menneske eller et dyr (Whitfield & Evans 1965). Det 
neurofysiologiske faenomen betegnes almindeligvis ’the neuron activation 
threshold’. 

Den neurologiske taerskel, der forarsager resultatet i fors0g med ’selective 
adaptation’, er en af de vigtigste funktioner i tilegnelsesprocessen. Nar flere 
nerveceller stimuleres simultant vha. dopamin, der er en neurokemisk 
transmitter (et opiat), forstaerkes synapseme, dvs. forbindelsen mellem 
neuroneme, og de danner et engram (Hebbs lov). Hukommelsen udg0r netop 
en akkumulation af engrammer. En f0lge af den forstaerkede forbindelse 
mellem neuroneme er, at neuronemes aktiveringstaerskel saenkes, si de 
kraever en mindre stimulation for at blive aktiveret. Dette er den neuro- 
fysiologiske irsag til, at det er muligt at manipulere med en fonetisk kategori- 
graense i fors0g med 'selective adaptation’. Som det tydeligt fremgir, har 
effekten ikke noget med det fonetiske niveau at g0re, men forirsages pi et 
neurologisk og auditivt niveau. 

Traek-detektor-modellen’ kan altsi hverken forklare resultater af fors0g med 
’selective adaptation', KP eller overfl0digg0re den fonetiske sprogprocessor. 
Det grundlaeggende problem ved modellen er, at den udg0r en tautologi og 
ikke en forklaring: 



"...the error lies in offering to explain phonetic capacity by making a substantive physiological 
mechanism out of a descriptive property of language" (Studdert-Kennedy 1982: 225). For 

For en diskussion om forskellen mellem fonetisk og auditiv adaption, se Springer (1979). 

o 
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"...the perceived feature is an attribute, not a constituent, of the percept, and we are absolved 
from positing specialized mechanisms for its extraction" (Studdert-Kennedy 1982: 227). 

I dette kapitel bar jeg fors0gt at give en beskrivelse af forskningsparadigmet 
KP. Det bar vaeret min bensigt at give et kronologisk overblik over et 
paradigme, der gennem de sidste 40 ar bar vaeret forskningsemne for en lang 
raekke forskellige fagomrader. Denne fagpluralisme, der kendetegner mange 
graenseomrader mellem de etablerede videnskaber, bar baft den betydning for 
forskningen i KP, at udviklingen af metodologien n0je korresponderer med 
hvem, der bar beskaeftiget sig med KP og bvornar . Netop for at undga de 
mange gentagelser, der ville vaere konsekvensen af separate afsnit om 
kronologien og metodologien, bar jeg valgt at bebandle disse to aspekter i en 
samlet beskrivelse - naturligvis med fare for at komme til at negligere de 
"sma" enest^ende, men oplysende unders0gelser. Det bar altsa vaeret min 
strategi kun at beskrive, bvad jeg opfatter som de vaesentligste bidrag og 
tendenser, snarere end at tilbyde en kvantitativ gennemgang. 

I det f0lgende er det min bensigt at diskutere en raekke teoretiske og 
metodiske sp0rgsmM, samt beskrive nogle af de vigtigste faktorer, der indgar 
i fors0g med KP. 
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2.2 Fors0g med kategorisk perception 

Som det fremgar af foregaende kronologiske og metodiske gennemgang af 
forskningsparadigmet kategorisk perception, har mange ars unders0gelser af 
dette faenomen rejst en lang raekke sp0rgsmal, men kun besvaret ganske fa. Et 
af de vaesentligste sp0rgsmal er - efter min opfattelse - hvorfor visse stimuli i 
h0jere grad end'andre kan fremkalde en kategorisk effekt, mens andre igen 
slet ikke fremkalder en kategorisk effekt, men snarere tyder pa kontinuerlig 
perception: resultateme af en lang raekke unders0gelser viser, at lukkelydene 
[p]i [t], [k], [b], [d] og [g] fremkalder den kraftigste kategoriske effekt; 
nasaler, lateraler og frikativer en mindre kategorisk effekt; og at vokaler 
perciperes kontinuerligt. 

OvenstSende sp0rgsmal om irsagen til asymmetri i KP af forskellige 
sproglyde kan naturligvis ikke besvares, medmindre man er i stand til at give 
en beskrivelse af de processer, der er involveret i sprogperception, og som 
enten forarsager den kategoriske effekt (fortolkes her som resultatet af KP) 
eller ikke resulterer i en kategorisk effekt (fortolkes her som resultatet af 
kontinuerlig perception). De eksisterende konkurrerende perceptions modeller 
bygger p& antagelser, der spaender fra rent fonetisk sprogperception til rent 
auditiv sprogperception; Den traditionelle Haskins-model tager udgangspunkt 
i en hypotese om, at sprogperceptionen er kendetegnet ved fonetisk syntese og 
at den er neurologisk naert forbundet med sprogartikulation (jf. side 22ff). 
Den st0rste teoretiske modsaetning til Haskins-modellen er nok Schoutens 
(1980, 1987) 'threshold-model*, der postulerer, at (ogsa) sprogperception kan 
forklares ud fra generelle (dvs. ikke specifikt sproglige) psykoakustiske 
principper. De to yderpunkter medieres af en raekke modeller, der antager, at 
sprogperceptionen del vis traekker pk fonetiske processer og delvis pa auditive 
processer - dog med stor forskel pa vaegtningen af de to perception smodi. 
Samtidig varierer disse modeller mht. om sprogperceptionen er en aktiv 
proces (f.eks. dual-process modellen) elfer en passiv proces (f.eks. raekken af 
auditive eller fonetiske traek-detektor-modeller). 

Problemstilling 

I det f0lgende vil jeg diskutere 3 hypoteser, der har stor betydning for 
tolkningen af faenomenet 'Kategorisk perception'. De tre hypoteser er 
hypotesen om stimulus-asymmetri, motorhypotesen og hypotesen om sprog- 
specifikke kategorigraenser. Endvidere vil jeg overveje, hvilke betingelser 
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Stimuli i fors0g med KP skal opfylde for at kunne belyse de mest centrale 
sp0rgsmll. 

Hypotesen om stimulus-asvmmetri 

Fors0g med KP viser almindeligvis, at lukkelyde (i CV-stavelser) i h0jere 
grad end nasaler, lateraler og frikativer fremkalder en kategorisk effekt, 
mens isolerede vokallyde slet ikke fremkalder en kategorisk effekt. Disse 
resultater har f0rt til en generel dikotomisk beskrivelse med perceptionen af 
hhv. vokaler og konsonanter som to adskilte faenomener. 

Data fra empiriske unders0gelser viser, at situationen er langt mere 
kompleks: For det f0rste viser fors0g med KP sjaeldent ideel kategorisk 
perception, dvs. en diskriminationsadfaerd, der udelukkende er betinget af 
kategoriseringen. Oftest er diskriminationen af stimuli fra samme kategori 
simpelthen bedre end forventetV For det andet viser unders0gelser med 
vokallyde praesenteret under varierede fors0gsbetingelser^, at graden af 
kategorisk effekt kan manipuleres: hvis de praesenterede vokalstimuli er 
tilstraekkelig korte, indgir i VC-stavelser eller udg0r diftonger, kan en 
kategorisk effekt fremkaldes (dog ikke en kategorisk effekt, der er lige sa 
kraftig som ved praesentationen af lukkelyde). 

Der er altsi meget, der tyder pi, at en dikotomisk beskrivelse af vokal- og 
konsonantperception ikke er adaekvat i forbindelse med fors0g med KP. Det 
er nok snarere n0dvendigt at tale om en graduering af KP, selvom dette 
strider mod Haskins-gruppens definition: 

“Categorical perception refers to a mode by which stimuli are responded to, and can only be 
responded to, in absolute terms. Successive stimuli drawn from a physical continuum are not 
perceived as forming a continuum, but as members of discrete categories. They are identified 
absolutely, that is, independently of the context in which they occur. Subjects asked to 



* Bortset fra Fry et al. (1962), der fandt en noget naer ideel kontinuerlig effekt i 
diskriminationen af vokallyde, viser alle fors0g, jeg er bekendt med, en bedre diskrimination 
end forventet. Cross & Lane (1964, citeret hos Lane 1965) har senere anvendt de samme 
magnetband, som Fry et al. (1962) anvendte, men uden samme ideelle kontinuerlige resultat 
(det skal dog tilfpjes, at Cross & Lane tilfpjede yderligere resonans, hvilket burde vaere 
irrelevant mht. diskriminationen af vokallyde). 

^ Det drejer sig her fprst og fremmest om 'masking' (bl.a. Massaro 1970, 1971; Repp et al. 
1979), interstimulus interval (bl.a. Cutting, Rosner & Foard 1976; Pisoni 1971, 1973; Repp 
et al. 1979), kontekst (bl.a. Fujisaki & Kawashima 1969, 1970; Pisoni 1975; Repp et al. 
1979), rangordning og reaktionstid (bl.a. Oden & Massaro 1978; Perey & Pisoni 1978; Pisoni 
&Tash 1974; Repp 1975). 
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discriminate between pairs of such "categorical" stimuli are able to discriminate between 
stimuli drawn from different categories^ but not between stimuli drawn from the same 
category. In other words, discrimination is limited by identification: subjects can only 
discriminate between stimuli that they identify differently" (Studdert-Kennedy, Liberman, 
Harris & Cooper 1970: 234, deres kursiv). 

I det f0lgende fors0g er det min hensigt at efterpr0ve hypotesen om en 
signifikant forskel mellem perceptionen af vokal- og konsonantlyde, her 
praesenteret under forhold, der almindeligvis postuleres at fremkalde den 
st0rste effekt. Det er min forventning at finde f0lgende 3 karakteristika i et 
fors0g med et VOT-kontinuum: 

1) Et markant skifte i identifikationsfunktionen. 

Dvs. en relativ kraftig stigning eller fald i identifikationsfunktionen. Det 
punkt pi det akustiske kontinuum, der inkluderes lige godt i to kategorier, 
udg0r en kategorigraense. 

2) En markant god diskrimination af stimuli fra forskellige kategorier. 

Dvs. en maksimal diskrimination ved kategorigraenser (ogsi kendt som den 
kategoriske effekt). 

3) En markant ringe diskrimination af stimuli fra samme kategori. 

Dvs. at stimuli fra samme kategori diskrimineres i faerre tilfaelde end stimuli 
fra forskellige kategorier. 

I et fors0g med et vokalkontinuum forventer jeg ikke at finde disse traek, der 
er karakteristiske for KP af lukkelyde. Derimod forventer jeg at kunne 
registrere f0lgende karakteristika: 

1) Et markant skifte i identifikationsfunktionen. 

2) En ringe diskrimination af stimuli, uafhaengigt af om de tilh0rer samme 
eller forskellige kategorier. 

Motor-hvpotesen 

If0lge synteseteorieme (jf. Haskins-modellen) udspringer sprogproduktion og 
sprogperception af samme saet artikulatoriske kommandoer. Denne antagelse 
medf0rer, at sprogbrugere ikke har adgang til information ud over de 
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fonetiske kategorier: fonetiske kategorier, der adskiller sig ved diskrete 
artikulatoriske egenskaber, perciperes som absolutte, diskrete st0rrelser, 
hvorimod perceptionen er kontinuerlig, nar kontinuerlig artikulatorisk 
variation mellem fonetiske kategorier er mulig. Med afsaet i denne antagelse 
tager synteseteorieme KP som en direkte afspejling af menneskets 
artikulatoriske potentiale: 

"When different phonetic categories are distinguished by essentially discrete articulatory 
gestures (as with stop consonants differing in voicing or place of articulation), perception of 
stimuli from a physical continuum spanning these categories will be categorical; on the other 
hand, when continuous articulatory variations between phonetic categories are possible (as 
with the vowels), perception will be continuous" (Repp 1984: 246). 

Hvis der eksisterer denne naere sammenhaeng mellem artikulation og 
perception, ma det ogsa betyde, at jo mindre artikulatorisk kontinuerlige 
sproglydene er, desto st0rre kategorisk effekt vil de udvise - og st0rre 
kontinuitet vil resultere i mindre kategorisk effekt. Denne hypotese er i fuld 
overensstemmelse med Haskins-modellen og den underbygges af en lang 
raekke fors0g med KP: Cutting 1974; Eimas 1963; Fry et al. 1962; Liberman 
et al. 1961, 1972; Pisoni 1971, 1973, 1975; Stevens et al. 1969, etc. 

Det er min hensigt at efterpr0ve ovenstaende hypotese i et fors0g med KP, 
hvor jeg praesenterer en serie stimuli, der udg0r et akustisk kontinuum, men 
som samtidig er mere eller mindre artikulatorisk kontinuerlig. Hvis 
artikulatorisk kontinuitet er den eneste faktor, der betinger KP, vil 
diskriminationen af akustisk diskontinuerlige stimuli vaere bedre end af 
akustisk kontinuerlige stimuli. Hvis dette ikke viser sig at vaere tilfaeldet, ma 
konklusionen n0dvendigvis vaere, at perceptionen af sproglyde ikke 
udelukkende bygger pa artikulatoriske kommandoer. 

Hvpotesen ona sprogspecifikke kategorigraenser 

Et af de mest centrale sp0rgsmal i forskningen i KP vedr0rer arsagen til den 
kategoriske effekt, dvs. Srsagen til, at fors0gspersoner udviser en relativ god 
diskrimination af stimuli fra forskellige kategorier, men ringe diskrimination 
af stimuli fra samme kategori. I hidtidige fors0g pa at give en adaekvat 
beskrivelse har man enten postuleret, at den kategoriske effekt forarsages af 
en fonetisk eller af en auditiv processering (for en oversigt se Strange & 
Jenkins 1978). 



O 




'61 



51 



Thomas 0. Madsen 



En af de metoder, man kan anvende i bestraebelsen pk at afdaekke forholdet 
mellem auditive og fonetiske processer, er komparative fors0g med fors0gs- 
personer, der taler forskellige modersmil. Med denne metode fors0ger man 
at afsl0re, hvordan fors0gspersoner med forskellige modersmal kategoriserer 
stimuli fra sannmie akustiske kontinuum - men ikke mindst om der er 
sammenfald mellem diskriminationstoppe og (eventuelt sprogspecifikke) 
kategorigraenser. Hvis den kategoriske effekt skyldes en psykoakustisk taerskel 
(jf. side 43 ff), kan man ikke alene forvente, at den determinerer fonetiske 
kategorigraenser, men ogsa diskriminationstoppene - uanset om den svarer til 
de lingvistiske graenser eller ej (Repp 1984). Hvis den kategoriske effekt 
derimod skyldes fonetisk kategorisering, mk den forventes at forekomme ved 
alle lingvistiske kategorigraenser - og kun der (Ades 1977). 

Stimulus-kriterier 

Udarbejdelsen af stimuli har naturligvis vaeret styret af en vaegtning mellem 
problemstillinger, jeg geme ville unders0ge og praktiske (tidsmaessige, 
tekniske og ressourcemaessige) begraensninger. I et kontrolleret fors0g, som 
det jeg her har beskaeftiget mig med, er stimulienes kvalitet af afg0rende 
betydning - f0rst og fremmest for resultatemes trovaerdighed. Derfor udg0r 
udarbejdelsen af stimuli en overordentlig tidskraevende faktor. Som en 
konsekvens af dette har jeg opstillet en raekke betingelser, alle stimuli skal 
kunne opfylde. 

1) For det f0rste skal de anvendte kontinua sa vidt muligt kun have et 
varierende akustisk karakteristikum^ Dette krav har jeg naturligvis opstillet 
af hensyn til tolkninger og sammenligninger af fors0gsresultater. 

2) For det andet skal stimuli virke sa naturlige som muligt. Der er endnu ikke 
udf0rt systematiske unders0gelser af denne faktors betydning for fors0g med 
KP. Jeg formoder dog, at man ville kunne spore en ringere kategorisk 
perception i fors0g med stimuli, der opfattes som unaturlige sproglyde, end 
med naturligt producerede stimuli (Liberman, Harris, Eimas, Lisker & 
Bastian 1961). Begrundelsen for denne antagelse er, at stimuli, der ikke 
opfattes som naturlige sproglyde, muligvis forleder fors0gspersoneme til 



^ Set ud fra et metodisk perspektiv er det en n0dvendighed, at den afhangige variabel er af en 
belt anden karakter end den uafhaengige variabel (dvs. den variabel, hvis aendringer man 
iagttager (Petersen 1995), hvis enhver form for cirkularitet skal undgas. Da form&let med dette 
fors0g er et studium af sprogperception, er det ganske naturligt at holde akustiske 
karakteristika som den kontrollerede (eller afhaengige) variabel. 
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udelukkende at anvende auditive strategier, hvorimod naturlige sproglyde 
sandsynligvis begunstiger en fonetisk strategi (se Repp 1984 for en diskussion 
om strategier i fors0g med KP). 

3) Endelig skal alle stimuli fra samme akustiske kontinuum have samme 
morfologiske status, dvs. at alle stimuli enten skal kunne opfattes som 
betydningsbaerende tegn eller som betydningsl0se sproglyde, men samme 
kontinuum ma ikke indeholde stimuli fra begge kategorier. For at undga en 
ukontrolleret semantisk variabel vil jeg endvidere tilstraebe, at stimuli, der 
kan opfattes som betydningsbaerende tegn, har samme leksikalske status og 
anvendelsesfrekvens. 

Vale af stimuli: et konsonantkontinuum 

Til fors0get med KP af et konsonantkontinuum har jeg valgt at anvende et [t]- 
[d]-kontinuum med varierende VOX. Den primaere ^sag til, at valget faldt pa 
netop denne fonetiske kontrast, er, at det med [t]-[d] er relativ let at skabe et 
akustisk kontinuum, der tager udgangspunkt i en naturligt produceret 
sproglyd: det er tilstraekkeligt gradvis at reducere aspirationslaengden ved et 
naturligt produceret [t] for at skabe et akustisk kontinuum, der daekker en 
overgang fra [t] til [d]. 

[t] og [d] er to af de seks danske lukkelyde [p], [t], [k], [b], [d] og [g]. 
Fonemisk adskilles klusileme p:b, t:d, k:g kun f0r (lige f0r eller som f0rste 
element i en konsonantgruppe f0r) fuldvokaler i danske ord (jf. Basb0ll 1997, 
1999). I alle andre positioner sker der en systematisk neutralisation, dvs. 
ophaevelse, af den forskel, der eksisterer i stavelsesinitial position f0r 
fuldvokal. 

Den artikulatoriske faellesnaevner for [t] og [d] er, at de begge dannes ved et 
alveolaert lukke med tungespids (og -blad) mod alveolarranden (lige bag 
fortaendeme i overmunden) og tungens sider mod kindtaendeme i over- 
munden. Der er kun ringe variation mht. artikulationssted: I nogle tilfaelde 
udg0r lukket i [t] og [d] dog ikke et alveolaert lukke, men et dentalt lukke. 
Palatogrammer viser oftest lige stor ber0ringsflade for [t] og [d] - nar dette 
ikke er tilfaeldet, Andes en anelse kraftigere ganeaftryk ved [d] (Hjelmslev 
1954). 
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Den st0rste forskel mellem [t] og [d] i initial position vedr0rer 
artikulationsmaden: [t] er staerkt aspireret, mens [d] er uaspireret eller meget 
lidt aspireret (malt vha. et aerometer, Fischer* J0rgensen 1966) og [t] 
produceres med aben glottis bade under lukke og aspiration, hvorimod [d] 
produceres med lukket eller ganske lidt aben glottis (konstateret ved 
endoskopiske unders0gelser). Varigheden af [t]'s aspiration er meget 
varierende - mere end pa f.eks. engelsk og tysk. Men netop i [t]'s aspiration 
ligger den vaesentligste, muligvis eneste forskel fra [d], der i dansk - til 
forskel fra mange andre sprog - manifesteres ustemt"^. Ingen hidtidige 
unders0gelser viser staerkere muskelspaending (tenuis) ved artikulationen af [t] 
end [d] - noget tyder pi, at det miske forholder sig lige omvendt (altsi at [t] 
er media)^ Eli Fischer-J0rgensens (1954, 1966) instrumentalfonetiske 
unders0gelser viser, at [d] altid har en kraftigere eksplosion end [t]. Desuden 
synes der at vaere den forskel, at eksplosionen i [t] slippes fri vha. 
luftstr0mmen, hvorimod den i [d] frig0res aktivt ved bevaegelse af tunge* 
spidsen. Denne beskrivelse underst0ttes endvidere af det faktum, at tunge* 
presset er st0rre ved [t] end [d]. I et komparativt perspektiv er det interessant, 
at [t] bedst kan karakteriseres ved en staerk aspiration kombineret med svag 
artikulation. 



Kombinationen af staerk aspiration og svag artikulation er medvirkende til det 
forhold, at det danske [t] ikke alene er karakteriseret ved aspiration, men ogsi 
affrikation. Affrikationen opstir som resultat af, at tungen slipper lukket 
langsomt, sa der kommer en lille haemmelyd inden pustet. Faktisk findes [t]'s 
affrikationsst0j, der f0lger lige efter eksplosionen, i akkurat samme frekvens* 
omrade som det danske [s] i f.eks. [asa] (Fischer-j0rgensen 1954, 1981). Ser 
vi pi den akustiske intensitet, er det tydeligt, at aspirations- og affrikations* 
st0jen i [t] er kraftigere end den smule aspiration, der kan findes i [d]. 



^ Denne beskrivelse kan dog i bedste fald kun daskke, hvad sen-jespersenianeme betegner 
'rigsmilsudtalen’, hvilket er "den udtale der kan findes hos mennesker fra alle egne af landet 
og som ikke er hyppigere hos mennesker med lav social status end mennesker med hpj social 
status" (Heger 1974: 45). F.eks. gaslder det for bomholmsk, at [d] er stemt, mens [t] er en 
uaspireret, spasndt lukkelyd (Hjelmslev 1954). 

^ Med dikotoinien tenuis/media refererer jeg i dette tilfaslde udelukkende til hhv. staerk og svag 
muskelspaending. Almindeligvis anvendes termeme tenuis/media som betegnelser for hhv. 
kraftig og svag eksplosion, men en kraftig eksplosion kan enten bero pi stor muskelspaending 
eller kraftig luftstrpm, der igen kan skyldes kraftigt ekspirationstryk eller meget iben passage 
gennem stemmelaebeme. Umiddelbart virker det miske mere hensigtsmaessigt at anvende 
termeme fortis/lenis som betegnelser for staerk og svag muskelspaending (jf. Hjelmslev 1954), 
men da man ved haemmelyde ofte bruger dem specifikt om kombinationen aif muskelspaending 
og ekspirationstryk, kan det blot skabe unpdig forvirring at give dem en anden anvendelse i 
beskrivelsen af lukkelyde (Fischer-Jprgensen 1962). 
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Derimod tyder det pS, at eksplosionen i [t] er kortere og har lavere intensitet. 
Eksplosionen i [t] kan - dog med lidt god vilje ~ skelnes fra den efterf0lgende 
kraftige affrikationsst0j i milinger af st0jens frekvensomrade, jf. figur 2.2.1. 

Ud fra et auditivt perspektiv er den eneste afg0rende forskel mellem [t] og [d] 
aspirationen. Fors0g med ombytning af eksplosionsfasen i [t] og [d] har vist, 
at selve eksplosionen ikke har nogen betydning for perceptionen. Endvidere 
er en pause mellem eksplosionen og vokalen heller ikke tilstraekkelig for 
perceptionen af et [t]; tilstedevaerelsen af aspirationsst0j er simpelthen 
n0dvendig for en identifikation som [t] (Fischer- J0rgensen 1966). 

I l0bet af arene 1994-98 har jeg udf0rt en lang raekke pilotfors0g med [t]-[d]- 
stimuli (jf- f eks. Jensen & Madsen 1995). Bl.a. har jeg fors0gt at 0ge 
(aspirations- og) eksplosionsintensiteten i et naturligt produceret [d] uden at 
det f0ite til en identifikation af stimulus som [t]. En svaekkelse af eksplosions- 
og aspirations intensiteten i et naturligt produceret [t] gav samme negative 
udfald^. Derimod har fors0g med gradvis reduktion af aspirationsst0j i et 
naturligt produceret [t] vist sig som en yderst pilidelig teknik til dannelsen af 
et akustisk kontinuum fra [t] til [d]. Jeg er ikke bekendt med nogen ulemper 
ved denne teknik. 

Som det fremgir af afsnittet om motorhypotesen (side 49f), er det min 
hensigt at afpr0ve hypotesen om direkte korrespondens mellem sprog- 
perception og -produktion. Til dette formal skal jeg bruge en serie stimuli, 
der udg0r et akustisk kontinuum, men som samtidig er mere eller mindre 
artikulatorisk kontinuerligt. I udarbejdelsen af det akustiske konsonant- 
kontinuum har jeg valgt at benytte mig af det forhold, at friktionsst0jen i et 
initialt [s] meget n0je svarer til aspirationsst0jen i et initialt [t]. 




* Medmindre teksten angiver andet, vil der herefter ikke blive skelnet mellem eksplosion og 
aspiration i behandlingen af danske lukkelyde. 
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Figur 2.2.1 Spektrogrammer af naturligt produceret 'sale', 'tale' og 'dale'. Bemaerk den 
store lighed: spektrogrammeme for 'tale' og 'dale' er naesten identiske med spektrogrammet 
for 'sale'; de indeholder blot mindre akustisk energi f0r VO. 



Der er dog to afg0rende forskelle mellem initialt [s] og [t]: friktionsst0jens 
begyndelse og varighed. For det f0rste er [s] en haemmelyd og ikke en lukke- 
1yd, dvs. at friktionsst0jen bliver gradvist kraftigere ved en stadig 0get luft- 
gennemstr0mning. Friktionsst0jen i [t] starter derimod fra et lukke med en 
mindre eksplosion og virker derved som en abrupt overgang. Det er dog 
muligt at skabe samme abrupte overgang i det, der oprindeligt blev opfattet 
som et initialt [s]. Hvis man fjemer den f0rste del af hvislelyden, si friktionen 
begynder meget brat, lyder den praecis som en eksplosion. Har man kun 
Qeniet en meget lille del af friktionsst0jen i initialt [s], si VOX er meget 
h0jere end for et normalt produceret [t], vil den manipulerede sproglyd blive 
opfattet som et [ts]. De milinger, jeg har foretaget af initialt [t] - produceret 
af mig selv’ - viser alle en VOX omkring 70 ms®. Reduceres VOX yderligere, 
vil den manipulerede sproglyd endelig blive opfattet som et [d]. 



’ Jeg kan nok bedst karakteriseres som en yngre rigsmils-Zregionalsprogstalende fynbo. 

* I et fors0g med dikotisk ly^ng i 1995 anvendte J0rgen N0rby Jensen og jeg en stimulus, 
der blev identificeret som initialt [t] (under ’forced choice’). Denne stimulus VO efter 80 
ms. Eli Fischer-j0rgensens (1954) instnimentalfonetiske unders0gelse af danske lukkelyde 
indbefatter af uvisse irsager ikke initialt [t]’s VOX (men VOX for [b], [d], [g], [p] og [k]). 
Hun pointerer dog den ekstreme variation i aspirationslaengde. 





Fors 0 g med kategorisk perception 



Som udgangspunkt for et VOT-kontinuum, der straekker sig fra [s] til [t] til 
[d], har jeg valgt et naturligt produceret [s]. For samtidig at opfylde de 
tidligere omtalte krav om naturlighed og ensartet morfologisk status vil 
stimuli blive ud£u*bejdet som en overgang fra 'sale' (pi. af substantivet 'en 
sal’) til 'tale' (infinitiven 'at tale' eller sg. af substantivet 'en tale') til 'dale’ 
(enten pi. af substantivet 'en dal' eller infinitiven 'at dale'). Den bisyllabiske 
struktur 'CV-Ca' er samtidig den mest udbredte stavelsesstruktur i danske ord. 
Naturligvis kunne jeg have valgt andre ord end lige 'sale', 'tale' og 'dale' — 
ogsa monosyllabiske - blot de kunne udg0re minimale par med [s], [t] og [d] - 
f.eks. bogstavnavnene for 'c', 't' og 'd'. Der er dog visse fordele ved 'sale', 
'tale' og 'dale', der gjorde, at valget faldt pa netop dem. Et vaesentligt 
kriterium var, at jeg 0nskede at anvende en akustisk stabil fuldvokal, dvs. en 
sa lang 'steady state' vokallyd som muligt. Et af de vaesentlige akustiske traek 
for perceptionen af lukkelyde er F2-transitioneme, der signalerer 
artikulationssted. Som beskrevet i Delattre et al. (1955) og Stevens et al. 
(1956) er resonans-frekvensen ved et alveolaert lukke omkring 1800 Hz - 
stort set uafhaengigt af den efterf0lgende vokal (jf. afsnittet om 'locus' side 
13f0. Dette betyder, at en efterf0lgende vokal med F2 i et vaesentlig lavere 
eller h0jere frekvensomrade ville fremtvinge transitioner i F2. Det fremgar 
af figur 2.2.1, at jeg har undgdet det problem. Hvis jeg havde valgt en anden 
vokal end [a], der netop pa dansk har F2 omkring 1800 Hz, ville det betyde, at 
jeg ikke kunne hindre en manipulation af den betydningsfulde F2-transition. 
Valget af [a] var altsd motiveret af kravene om kun et varierende akustisk 
karakteristikum og st0rst mulig naturlighed. 

Udarbejdelse af VOT-kontinuum 

Som f0rste trin i udarbejdelsen af et VOT-kontinuum indtalte jeg ordet 'sale' 
pa en baerbar pc ved hjaelp af dens indbyggede mikrofon. 'Sale' blev indtalt 
direkte pa en 16-bit lydfil, der daekker omradet fra 0 til 44.100 Hz. 

Udtalen kan bedst karakteriseres som 'afslappet udtale af den isolerede form’, 
uden schwa-assimilation og i overensstemmelse med den form, der angives i 
Peter Molbaek Hansens Dansk udtale (1990) og Lars Brink et al.'s Den store 
danske udtaleordbog (1991). 
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Demaest gik jeg i gang med at tilpasse den alt for lange lydfil til det 
digitaliserede signal. Resultatet blev en 709,32 ms lydfil (±0,0227 ms’), jf. 
figur 2.2.2. 
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Figur 2.2.2 



En raekke kardinalpunkter kan bade males i relation til begyndelsen af 
lydfilen og begyndelsen af signalet (herefter vil alle malinger relateres til 
begyndelsen af signalet): 




Figur 2.2.3 



Det eneste, der nu kraevedes for at skabe et akustisk kontinuum, var en trinvis 
reduktion af VOX. Jeg valgte at holde alle faktorer konstante bortset fra, at 
jeg for hvert trin erstattede de fprste 10 ms friktionsstdj med stilhed. Figur 
2.2.4 nedenfor angiver de 14 stimulis VOT^®: 
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Figur 2.2.4 



Hvis man sammenligner det akustiske kontinuum i figur 2.2.4 med mine egne 
malinger af VOX ved initialt [t], der oftest bar VO efter 70-75 ms, kan man 



® Alle tidsmilinger er behaeftet med denne ekstremt lille usikkerhed. Da alle stimuli blev indtalt 
pS lydfiler, der rummer 44. 100 Hz., havde de mindste dele jeg kunne manipulere, en laengde 
p& (1 sekund 44.100 Hz. = 0,0000227 sekund.) 0,0227 ms. 

° De i alt 14 lydfiler betegnes C-Ol.wav - C-14.wav. 
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forvente, at i hvert fald stimulus 6 og 7 vil tilh0re den fonetiske [t]-kategori. 
Desuden er det vaerd at bemaerke, at jeg med stimulus 14 bar valgt at reducere 
signalet selv efter VO. Formalet med dannelsen af den - pa dansk unaturlige - 
stimulus er at unders0ge, om den akustiske stemthedsgraense korresponderer 
med en kategorisk effekt. Det er min forventning, at den akustiske 
stemthedsgraense vil markere en stigning i diskriminationen mellem stimulus 
13 og 14 (i sammenligning med f.eks. stimulus 12 og 13). 

Tekniske data 

Udarbejdelsen af fors0get med KP lader sig dele op i flere faser. Der har 
saledes vaeret anvendt forskelligt udstyr til indtaling og manipulation af 
stimuli, selve praesentationsprogrammet samt til behandlingen af de endelige 
fors0gsresultater. 

Til udarbejdelsen af et VOT-kontinuum anvendte jeg en baerbar pc, en 
Toshiba 220CS med indbygget 16-bit lydkort (venligst udllnt af IT- 
Funktionen, Humaniora, Odense Universitet). Den f0rste stimulus blev vha. 
den indbyggede mikrofon indtalt direkte pa en to-spors 16-bit lydfil (*.wav- 
fil af PCM-typen, 44.100 Hz) i lydbehandlingsprogrammet GoldWave ver. 
2.0 (copyright Chris S. Craig 1993). 

GoldWave-programmet g0r det muligt at indspille og afspille forskellige lyde 
pi wav-filer af varierende laengde. Der kan endvidere opstilles separate 
oscillogrammer (men ikke spektrogrammer) for lydene i hhv. venstre og 
h0jre kanal. En lang raekke funktioner muligg0r desuden forskellige former 
for manipulation med de indspillede lyde, bl.a. aendre amplitude, indsaette 
pause, etc. GoldWave-programmet blev valgt, fordi det “ i modsaetning til de 
fleste andre lydbehandlingsprogrammer - g0r det muligt at manipulere 
separat med lydene i de to kanaler, en funktion, der vil blive beskrevet 
naermere i forbindelse med fors0g med dikotisk praesentation (side 12 If). 

Vale af stimuli: et vokalkontinuum 

Til fors0get med KP af et vokalkontinuum har jeg valgt at anvende et [i]-[e]- 
[ae]-[a]-kontinuum, der varierer mht. FI og F2. Til forskel fra det akustiske 
VOT-kontinuum, der repraesenterer konsonantserien, var det praktisk talt 
umuligt for mig at danne et vokalkontinuum, der udspringer af naturligt 
producerede sproglyde. Selvom vokaleme i h0jere grad end konsonanteme 
udg0r et artikulatorisk kontinuum, kan vi ikke udtale dem, sa de manifesteres 
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som akustisk ekvidifferente vokallyde. Jeg var med andre ord n0dsaget til at 
anvende syntetisk producerede vokallyde. 

[i], [e], [ae] og [a] udg0r 4 af de 10 danske vokalfonemer^^ De er alle stemte 
lyde, dvs., at stemmelaebeme er i vibration. Desuden er vokaleme 
karakteriseret ved at have svaelg- og mundhulrummet som resonansrum; ved 
udtalen af danske vokaler er naesehulrummet lukket ved at ganesejlet er haevet 
og sMedes blokerer for luftgennemstr0mning‘^. Resonansrummet kan varieres 
pk 3 mader: ved aendret laebestilling, artikulationssted og abningsgrad. Laebe- 
stillingen er bestemmende for, om resonansrummets abning er stor eller lille. 
Alene ved at aendre laebemes stilling, kan vi altsa aendre vokalen. Desuden kan 
vi aendre resonansrummets form ved at aendre tungens position i munden. Og 
endelig aendrer vi resonansrummets volumen/rumfylde, nSr vi aendrer pa 
mundens abningsgrad. 

[i], [e], [ae] og [a] er alle kendetegnet ved at vaere fortungevokaler, dvs. at de 
artikuleres med hele tungemassen skudt frem og fortungen haevet mod den 
hSrde gane. Endvidere adskiller disse 4 fortungevokaler sig artikulatorisk fra 
de resterende fortungevokaler ved ikke at have laeberunding. Der er dog 
forskel pa de 4 vokalers Abningsgrad: [i] betegnes typisk som snaever, [e] som 
halvsnaever, [ae] som halvaben og [a] som aben^^ Vi ma dog ikke glemme, at 
der i almindeligt talesprog er tale om glidende overgange mellem f.eks. for- 
tunge og bagtunge, aben og snaever etc. Saledes viser flere palatogram- 
unders0gelser af de urundede fortungevokaler [i], [e], [ae] og [a] (se f.eks. 
Fischer- J0rgensen 1962), at artikulationssted korrelerer med abningsgrad: jo 
st0rre kaebesaenkning, desto mere tilbagetrukket tungemasse^"^. 



“ Antallet af (vokal-)fonemer afhaenger naturligvis af, hvordan man 0nsker at fortolke en 
raekke manifestationer. Jeg vil ikke ga ind i en diskussion af det danske foneminventar her, da 
det ikke har (direkte) relevans for unders0gelsen eller anvendte stimuli. 

Jeg ser her bort fta dialektale traek som f.eks. de fynske nasalvokaler. Nasalvokaler er 
desuden almindelige i andre sprog, f.eks. polsk [^] og [^] i f.eks. 'przysi^gn^e' (svaerge) og 
de franske nasalvokaler i 'un bon vin blanc' (en god hvidvin). 

Jeg har valgt terminologien snaever, halvsnaever, halvSben og aben, bl.a. fordi den svarer til 
den engelske terminologi close, half-close, half-open og open. Otto Jespersen anvendte 
udtrykkene naer, halvnaer, halvfjem og fjem, andre taler om h0jtstillet og lavtstillet, lukket og 
Iben (se Heger 1981 for en diskussion om terminologien). Det er vigtigt at pointere, at jeg ved 
Abningsgrad fokuserer pa tungemassens toppunkt i relation til ganen/ganesejlet og ikke 
ber0ringsfladen, som det er tilfaeldet hos Fischer-J0rgensen (1962). 

Denne relation er ikke et specifikt dansk faenomen, men skyldes et rent fysiologiske 
forhold, nemlig kaebens '’hangser*. 
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Det vaesentligste i en akustisk beskrivelse af vokaleme er, at de er rent 
periodiske, dvs. at de ikke indeholder komponenter, der star i uharmonisk 
forhold til grundtonen (herefter FO). Desuden er de karakteriseret ved en 
udpraeget formantstruktur, dvs. intensiteten er koncentreret i visse frekvens- 
omrSder (jf. beskrivelsen af formanter side 8ff). Tilsyneladende har F4 og 
h0jere formanter ikke nogen synderlig betydning for vokalemes forskellighed 
- de er nogenlunde ens for forskellige vokaler, men kan variere fra person til 
person^^ FI og F2 er derimod meget vigtige for alle vokaler. Det er f0rst og 
fremmest deres position, der bestemmer vokalkvaliteten; de skifter fra vokal 
til vokal og har nogenlunde samme position for samme vokal udtalt af 
forskellige personer, jf. figur 2.2.5. 
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Figur 2.2.5 Spektrogrammer af danske lange vokaler - her de urundede fortungevokaler 
[id» [e:], [^'] og [a:]. Tallene 1-4 angiver formanter. (Fischer-j0rgensen 1981:22). 



Nar man taler om akustiske traek, der har afg0rende betydning for 
perceptionen og identifikationen af vokaler, fokuseres der primaert ph de to 
f0rste (relativt kraftigste) overtoneomrader, FI og F2. Hvis man opstiller de 
to f0rste formanter i et todimensionalt diagram med FI lodret og F2 vandret, 
fir man en figur, der i forbl0ffende grad minder om en artikulatorisk 



F4 og h0jere formanter medvirker til dels til den individuelle stemmeklang, bl.a. g0r 
kraftige h0je formanter stemmen mere lys og skarp (Fischer- J0rgensen 1962). F3 er hos de 
fleste meget svag ved bagtungevokaleme og bidrager her naeppe meget til vokalklangen, mens 
den er kraftigere ved fortungevokaleme og muligvis har en vis indvirkning pS perceptionen og 
identifikationen (Thorsen & Thorsen 1976). Ofte praesenteres vokaler i et todimensionalt 
diagram, hvor den ene akse repraesenterer F2' (laes 'F2 maerke’), der er en ’’vaegtet 
gennemsnitsformant” beregnet ud fra F2 og F3 (Fant 1958, Fr0kjaer-Jensen 1966). 
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vokalfigur (med Ibningsgrad lodret og artikulationssted vandret), jf. figur 

2 . 2 . 6 . 



Vokalformanter 

F2 




Figur 2.2.6 Et todimensionalt diagram med FI lodret og F2 vandret. De markerede 
omr&der repraesenterer de danske lange urundede fortungevokaler [i:], [e:], [ae:] og [a:]. 
Frekvensvaerdieme udg0r et gennemsnit af formantfrekvenseme hos 10 mandlige forsdgs- 
personer under udtalen af langvokaler i en bisyllabisk 'CV:-C9' -stmktur. Diagrammet er 
baseret pk data fra Fr0kjaer-Jensen (1966:35). 



Figur 2.2.6 bar en stor og ikke tilfaeldig lighed med artikulatoriske vokal- 
figurer, der illustrerer forholdet mellem ibningsgrad og artikulationssted. De 
urundede fortungevokaler adskiller sig fra hinanden ved ibningsgrad: [i:], 
[e:], [ae:] og [a:] er hhv. snaever, halvsnaever, halviben og iben. Samtidig 
korresponderer abningsgraden med artikulationsstedet siledes, at fortunge- 
vokaler udtales med mere og mere tilbagetrukket tungemasse, jo mere kbcn 
kaebestillingen er. Der er altsi - ikke overraskende - en korrelation mellem 
taleorganemes position og formantstrukturen i artikulationens produkt, dvs. 
det akustiske signal (jf. side 9f). 

Som en meget simpel tommelfingerregel for formantfrekvenseme s 
beliggenhed kan man sige, at FI haenger sammen med ibningsgrad, mens F2 
vedr0rer artikulationssted og runding (Fischer-J0rgensen 1962, Thorsen & 
Thorsen 1976, Fr0kjaer-Jensen 1966). Fk trods af at relationeme mellem 
resonansrum og formanter ikke er belt simple, er det i dag muligt at beregne 
formanteme ret n0jagtigt, bvis man blot kender laebeibningen, stedet for den 
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staerkeste indsnaevring samt tvaersnitsarealet pa dette sted. Nar man husker pa, 
at store hulrum har dyb resonans og sma hulrum h0j resonans, er det muligt 
at se sammenhaengen mellem artikulationen og formantstrukturen i [i], [e], [ae] 
og [a]. Ved de mest abne fortungevokaler er resonanshulrummet bag tungens 
toppunkt mindre end ved de snaevre, hvilket resulterer i en h0jere FI. Som 
tidligere omtalt medf0rer en stigning i abningsgrad, at tungemassen traekkes 
tilbage og derved skaber et st0rre resonanshulrum foran tungens toppunkt, 
hvilket manifesteres ved et fald i F2. En gradvis for0gelse af fortunge- 
vokalemes Ibningsgrad kan altsa med al rimelighed fortolkes som en 
bevaegelse fra snaevre fortungevokaler mod abne bagtungevokaler*®. 

Resultatet af ovenstaende analyser og overvejelser var, at jeg var n0dt til at 
danne et akustisk vokalkontinuum med to varierende faktorer, nemlig FI og 
F2, hvis stimuli skulle svare til formantstrukturen i naturligt producerede 
vokallyde. I f0rste omgang valgte jeg - ved hjaelp af en synthesizer (se naeste 
afsnit) - at danne en raekke stimuli baseret pa analyser af min egen vokal- 
produktion. Desvaerre viste resultatet sig ikke at vaere tilfredsstillende - de 
syntetiske stimuli l0d ikke tilnaermelsesvis som naturligt producerede vokal- 
lyde, hvorfor jeg mStte opgive denne strategi. Arsagen til at de syntetiserede 
lyde havde sa ringe auditiv lighed med naturlige vokallyde er muligvis, at den 
synthesizer, jeg anvendte, udelukkende kunne variere FI og F2, men med en 
praedefineret F3 pk ca. 3500 Hz og F4 pk ca. 3900 Hz. Til sammenligning kan 
det oplyses, at F3 ved udtalen af [i] og [a] hos maend er omkring 3000/2300 
Hz, hos kvinder 3400/2900 Hz og hos b0m 3500/3050 Hz^^. 

Da jeg ikke kunne danne et syntetisk vokalkontinuum baseret pa min egen 
vokalproduktion, var jeg n0dsaget til at anvende en auditiv metode. I sam- 
arbejde med Kirsten Gregersen fandt jeg vha. talesynthesizeren, hvad jeg rent 
auditivt opfattede som bedste eksempel pa et [i] og et [a]. Disse to skulle 
udg0re endepunkteme for en lineaer funktion mellem FI og F2 - altsd det 
akustiske vokalkontinuum, jf. figur 2.2.7. 



Denne beskrivelse er belt i overensstemmelse med flere nyere generelle vokalmodeller, bl.a. 
Basb0ll & Wagners (1985) vokalmodel, der ikke indbefatter et hj0me for ibne 
fortungevokaler. 

’’ Disse data stammer fra Fr0kjaer-Jensens (1966) analyser af 25 danskeres vokalproduktion. 
Forskellene mellem maend, kvinder og b0ms formantfrekvenser forirsages af fysiologiske 
forskelle: kvinder og b0m bar et mindre resonanshulrum, f0rst og fremmest et kortere svaelg; i 
gennemsnit ligger formantfrekvenseme bos kvinder 17% h0jere end bos maend. 
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Figur 2.2.7 

Jeg valgte at dele det beregnede akustiske kontinuum op i 18 lige store 
intervaller, hvilket resulterede i 19 stimuli. Valget af netop 19 formantpar 
som stimuli skyldes en raekke overvejelser om forholdet mellem antallet af 
stimuli og de sprogspecifikke kategorier. 

For det f0rste skal der vaere grundlag for en sammenligning mellem de to 
kontinua. Da det udarbejdede korisonantkontinuum udgjorde 12 stimuli og 
forventedes at daekke 3 fonetiske kategorier, skal det syntetiske vokal- 
kontinuum med forventede 4 kategorier indeholde flere end de 12 stimuli. 

For det andet skal der vaere grundlag for en sammenligning af 
kategoriseringer ved praesentation af samme akustiske kontinuum for fors0gs- 
personer med forskellige modersmSl. Hvis jeg havde valgt at inddele det 
syntetiske vokalkontinuum i relativt fi stimuli, ville der vaere en vis risiko for 
sammenfald mellem forskellige sprogs kategorier - et sammenfald 
udelukkende determineret af alt for store akustiske spring. 

Omvendt er der ogsh en ulempe forbundet med en si fm opdeling af det 
syntetiske kontinuum. Det er ganske klart, at en ringe diskrimination mellem 
meget forskellige stimuli er et langt vaegtigere argument for kategorisk 
perception end ringe diskrimination mellem stimuli, der kun varierer ad 
ganske smi kvantitative skridt. 

For at skabe et akustisk kontinuum bestaende af 19 stimuli - fra [i] til [a], jf. 
figur 2.2.7 - fandt jeg differencen mellem hhv. [i] og [a]’s FI- og F2- 
frekvenser (FI: 300 Hz, F2: 800 Hz). Derefter dividerede jeg differenceme 
med 18, hvorved jeg fandt afstanden mellem hver stimulus; for hvert skridt 
fra [i] mod [a] stiger FI med 16,66 Hz og F2 falder med 44,44 Hz. De to 
parametre FI og F2 blev saledes inddelt i 19 punkter som illustreret i figur 
2 . 2 . 8 . 
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I et Fl-F2-diagram som figur 2.2.9 fremgar det tydeligt, at de 19 syntetiske 
stimuli udg0r et vokalkontinuum - vel at maerke et akustisk kontinuum, der 
skal foregive at vaere et artikulatorisk kontinuum fra en snasver fortungevokal 
[i] til et abent, tilbagetrukket [a]. 
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Udarbejdelse af et formantkontinuum 

Da jeg f0rst havde beregnet det akustiske kontinuum, manglede jeg blot at 
realisere de syntetiske stimuli. Til udarbejdelsen af de konkrete stimuli 
anvendte jeg en talesynthesizer (jf. afsnittet med tekniske data, side 58), der 
kan variere FI, F2 samt FO (grundtonen). For ikke at lade grundtonen have 
indflydelse pa diskriminationen, valgte jeg at lade den vaere konstant omkring 
140 Hz (se FFT-analyse af stimuli i bilag A). 
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Ved hjaelp af en talesynthesizer, der var direkte forbundet med en PowerPC, 
kunne jeg nu foretage spektralanalyser af synthesizerens output. Proceduren 
var ganske simpel: f0rst valgte jeg et koordinat pa synthesizerens eksteme FI- 
F2-diagram, hvorefter jeg foretog en spektralanalyse af det akustiske signal, 
Naturligvis indebar denne procedure, at jeg gang pa gang matte justere 
koordinateme, for at fS dem til at svare til de praedeflnerede formantvaerdier. 
Nk jeg endelig havde fundet en koordinat, der kunne producere de 0nskede 
formantfrekvenser, blev det akustiske signal gemt pa en ^t-spors 16-bit lydfil 
(*.sig-fil, 22050 Hz) vha. lydbehandlingsprogrammet Signalyze™. 

I f0rste omgang havde jeg gemt alle stimuli i lydfiler af 2000 ms varighed. 
-Men syntetisk producerede vokallyde af den laengde minder slet ikke om 
naturligt producerede sproglyde. Naeste opgave var derfor at reducere det 
akustiske signal til 350 ms. Tidligere unders0gelser af vokallaengdens effekt 
viser entydigt, at lange vokallyde (200-300 ms) giver en relativt h0j 
diskrimination, mens korte vokaler (50-150 ms) giver en lav diskrimination 
(Pisoni 1971, 1973, 1975; Sachs 1969). Jeg valgte her at lade en relativt lang- 
varig vokal (350 ms) kompensere for den store svaerhedsgrad, som blev 
fremkaldt af de meget sm^ akustiske forskelle. Det skal dog samtidig tilf0jes, 
at de syntetiske vokallyde herefter blev tilspidset over 50 ms i hver ende 
(tapering), hvilket resulterer i 250 ms konstant vokallyd^®. 

Endelig blev samtlige 19 lydfiler konverteret fra *.sig til *.wav-filer ved 
hjaelp af et konverteringsprogram, FileConverter 2.11.1 (udviklet af Stefan 
Werner, freeware), som er en del af Signalyze-pakken. 

Min tidlige skepsis ved syntetisk producerede vokallyde blev afl0st af en stor 
tilfredshed med det endelige resultat; ikke alene kan de syntetiske signaler 
med lethed identificeres som vokallyde, de lyder heller ikke sa unaturligt, 
som jeg havde frygtet. 

Tekniske data 

Til udarbejdelsen af et syntetisk vokalkontinuum anvendte jeg en tale- 
synthesizer, FONEMA OVE I resonator, med variabel FI og F2, men 

** 250 ms signal er dog stadig en relativ lang langvokal. Niels Reinholt Petersen (1976) har i 
et fors0g med KP af kort versus lang vokal fundet, at danske sprogbrugeres kategorigraense er 
omkring 140 ms. Fors0gspersoner blev endvidere bedt om at tilpasse fuldvokalens laengde i 
ordet ’laese’ "...in accordance with a criterion of "naturalness"" (Petersen 1976: 69). Det viste 
sig, at fors0gspersoneme foretrak en varighed over eller omkring 200 ms for en langvok^. 

o 
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invariabel F3 og F4 (se side 62). OVE I er i modsaetning til de senere 
generationer OVE II og OVE Illa-d kun i stand til at producere syntetiske 
vokallyde, ikke aperiodiske signaler. Vokalsynthesizeren var venligst udlant 
af Fonetisk laboratorium, Odense Universitet. OVE I blev forbundet direkte 
med en PowerPC via linjeindgangen. 

Den software, der blev anvendt til analyse og manipulation af stimuli, er et 
stort lydbehandlingsprogram, Signalyze^^, som Fonetisk Laboratorium pa 
Odense Universitet k0bte licens til for et par ar siden. Signalyze^^ version 
3.12 (copyright Eric Keller 1988-1994) er et omfattende, kraftfuldt program, 
der primaert er designet til analyse af sprog. Til analysen af de akustiske 
signaler (jf. akustiske analyser i bilag A) anvendte jeg et FFT-spektrogram 
(Fast Fourier Transform) med 'wide band’ (8 ms/I25 Hz) samt et FFT- 
spektrum (0-5512 Hz)^^. Alle, der har pr0vet at arbejde med akustisk analyse 
ved, at det er meget svaert at foretage praecise malinger. Pa trods af stor 
grundighed er alle frekvensvaerdier da ogsa behaeftet med en usikkerhed pa 
±5 Hz. 

Procedure; praesentations- og registreringsprogram 
Til fors0gene udviklede jeg et program specielt konstrueret til kontrolleret 
praesentation af akustiske stimuli og registrering af fors0gspersoners respons. 
Programmet fik navnet 'DikoTest 3.0’. 

De to f0rste versioner af DikoTest blev egentlig udviklet i 1994-95 i et 
samarbejde mellem Nikolaj Frandsen, J0rgen N0rby Jensen og undertegnede 
(Jensen & Madsen 1995). Pa davaerende tidspunkt arbejdede J0rgen og jeg 
med dikotisk lytning (deraf navnet ’DikoTest’). Det var egentlig min intention 
at anvende samme program - dog i en modificeret form - til fors0g med KP, 
men da den oprindelige kode desvaerre er gaet tabt, var jeg n0dt til at 
programmere en belt ny version. DikoTest 3.0 har jeg udviklet ved hjaslp af 
’Microsoft Visual Basic 3.0’, der er et komplekst og kraftfuldt program til 
udarbejdelse af softwareprogrammer til pc’er (kraever Windows som 
styresystem). 

DikoTest 3.0 er konstrueret, sa det kan afspille lydfiler, praesentere tekst pa 
skaermen samt registrere fors0gspersoners respons pa tastaturet. Hele denne 



For yderligere tekniske data se Keller 1994. 
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procedure varetages af hhv. en styrefil (*.csv-fil) og en registreringsfil 
(*.csr-fil). 

Praesentationsserier og registrering 

Styrefileme bestir af praesentationsserier, der alle er bygget op efter samme 
princip: f0rst defineres en *.wav-lydfil, som DikoTest kan afspille i medie- 
afspilleren. Demaest praesenteres den tilh0rende tekst pa skaermen: 

ldentifikations0velser^ ^: 

Konsonanter: ’H0rer du et D, S eller T? Svar med tast. #xx’ 

Vokaler: ’H0rer du et A, E, I eller Svar med tast. #xx’ 

Diskriminationsovelser (bade konsonanter og vokaler): 

Praesentation af 1yd 1: 'Lyd 1. #xx’ 

Praesentation af lyd 2: 'Lyd 2. Ens eller forskellige? #xx' 

DikoTest 3.0 giver mulighed for automatisk praesentation med faste inter- 
valler af 1 til 5000 ms varighed. Jeg havde dog valgt ikke at anvende den 
automatiske praesentation, men derimod lade fors0gspersoneme selv 
bestemme hastigheden; nar fors0gspersonen havde afgivet respons pi 
tastaturet (eller h0rt lyd 1), skulle han/hun selv trykke pi tasten [pil ned] for 
en ny praesentation. 

Nir fors0gspersoneme responderede pa akustiske stimuli og tekst ved tryk pi 
tastaturet, blev lydfilens navn, den praesenterede tekst, responsen samt 
reaktionstiden registreret i en registreringsfil (*.csr-fil). DikoTest 3.0 giver 
endvidere mulighed for indskrivning af oplysninger om fors0gspersoneme. 

Som udgangspunkt for praesentationsseriemes opbygning blev der opstillet en 
bestemt raekkef0lge af stimuli i regnearkprogrammet Microsoft Excel. 

For det akustiske S-T-D-kontinuum blev der fremstillet en identifikationsserie 
bestiende af 28 praesentationer, dvs. at hver af de 14 stimuli blev praesenteret 
2 gange i en serie. Diskriminationsserien bestod derimod af 40 stimuluspar, 
der var kombineret, si hver stimulus blev kontrasteret med den foregiende, 

Jeg valgte at opstille svarmulighedeme i alfabetisk raekkefplge, da jeg forventer, at kun 
ganske fa af fors0gspersoneme har viden om fonetiske sy sterner. '#xx' repraesenterer et 
praesentationsnummer, som forspgspersoneme skulle notere, hvis deres respons via tastaturet 
var forkert, dvs. utilsigtet. 
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den samme og den efterf0lgende stimulus i det akustiske kontinuum. F.eks. 
blev stimulus 3 (C-03.wav) kontrasteret med stimulus 2 (C-02.wav), stimulus 
3 og stimulus 4 (C-04.wav), og stimulus 4 med 3, 4 og 5, etc^^ Saledes bestod 
diskriminationsserier med konsonant- stimuli af 40 par ((14 • 3) - 2), hvoraf 
14 var ens og 26 forskellige. 

For det syntetiske vokalkontinuum blev der fremstillet en identifikationsserie 
bestSende af 19 praesentationer, dvs., at hver af de 19 stimuli blev praesenteret 
1 gang i en serie. Endelig bestod diskriminationsserien med vokalstimuli af 55 
stimuluspar, der var kombineret efter samme princip som beskrevet ovenfor 
ved konsonantdiskrimination, dvs. 55 par ((19 • 3) - 2), hvoraf 19 var ens og 
36 forskellige. 

Endelig skal det tilf0jes, at alle praesentationsserier blev indledt af en 
"introduktionsrunde" bestaende af 6 identifikations- eller diskriminations- 
0velser. Formalet med "introduktionsrunden" var udelukkende at give 
fors0gspersoneme mulighed for vaenne sig til udstyr, procedure etc. Data fra 
disse ’’introduktionsrunder" er ikke medregnet som fors0gsresultater. 

De 4 basisserier for konsonantidentifikation, konsonantdiskrimination, vokal- 
identiEkation og vokaldiskrimination bliver herefter betegnet 'C-Iden- 
Basis.XLS’, 'C-Disk-Basis.XLS', 'V-Iden-Basis.XLS' og ’V-Disk-Basis.XLS' 



Praesentationsseriemes opbygning i de 4 basisserier er udgangspunkt for 
udviklingen af alle andre serier. Ved hjaelp af funktionen 'slump' (i regneark- 
programmet Microsoft Excel) kunne jeg tilskrive hver praesentations- 
kommando en vilkarlig talvaerdi og derefter sortere dem med faldende 
vaerdier. Saledes genererede jeg for hver basisserie 5 styrefiler med hhv. 28, 
40, 19 og 55 praesentationer i tilfaeldig raekkef0lge, se figur 2.2.10. 




Crldenr 1 .CSV (^8 praes. i tilfgldig' raekkeflg.) 
C-lden“2.csv (28 praes. i til fsei dig raekkeflg^) J 

I G-lden-3.csv (€8 praes. I tilfsldig raekkeflg;) j 

Gdden-41c sv (28 pras.j; tijfe 1 ,] 

(28 i nks. i^t iifa eldigTg^ j 



Jeg har valgt at dobbeltrepraesentere stimuli i kontrastserieme (f.eks. stimulus 3 versus 
stimulus 4 og 4 versus 3) for at sikre resultateme mod bias pga. prssentationsrskkefolgen 
som intervenerende variabel. 



o 
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■ .CSV (40 priss. 'i tilfagldig nekkeflg.)-' ^ •• { 

: ’ W'-. _ •;: . j 

■ .;G|pis|-B|sis^^^^ C»^Disk-3.csv- (40 praes. i. tilfaeldig nekkeflg.) '■ y^- .- ! 

Cj gi^^.csy (4jP pfgs. ijijfejdig nekkeflg.), I 

^ -C>Disk-5.csv <4apras^| tnfeldjg nekkjfjg;) ;'i 

y>iden-:lxsv (19 pras4 Mlfaldjg raek^^ 

Jj^lden^ ; - j 

y-lden^3xsv (i^pres.idlfelcH j 

■%-y "' ' - ••. ■ ■- ■■ ■ ' ■■’ :'■=■ ' ■ - „■ ! 

y:Idenk5.csy (19 prags. i tilfeldig rgjdceflg.) | 










3 V’Disk-l.csv (55 pfss. i tilfaldlg raekkeflg.) 



V-i>isk - 2xs v (55 prffis; i tilfaeidig i^kke fly) 




Figur 2.2.10 



V~Disk«3.csv (55 prgs ,i tilfaglAg raekkeflg.) 
y-Pi sk-4.csv (55 prffis.1 U lfaeldig rgkkehg.) 
V- Pisk-5.csv (55 praes. i ti lfagldig raekkeflg.) 



Ved behandlingen af de endelige fors0gsresultater blev regnearkprogrammet 
Microsoft Excel ligeledes benyttet. De (4 • 5) 20 fors0gsseriers tilh0rende 
resultatfiler blev placeret i regnearket og ved hjaelp af kommandoen 'sorter' 
blev data (lydfilens navn, den praesenterede tekst, respons pS tastatur samt 
reaktionstid) herefter f0rt tilbage i basisseriens oprindelige raekkef0lge. 



Forsogsforhold 

DikoTest-programmet blev installeret i en baerbar pc (se afsnit om tekniske 
data side 58), som blev brugt til alle fors0gene. Et par h0jkvalitets stereo- 
hovedtelefoner af maerket Sennheiser HD 480 blev ligeledes benyttet under 
alle fors0gene. 



Alle fors0gene blev foretaget i perioden 12. juni - 10. juli 1998; fors0g med 
finske fp: 17. - 20. juni; fors0g med danske fp: 12. juni - 10. juli. Gruppen af 
finske fors0gspersoner deltog i juni mined i danskkurser (Sommer- 
universitet) pi Odense Universitet, hvor de bl.a. blev undervist i dansk 
fonetik (af undertegnede). Undervisningen i dansk fonetik begraensede sig til 
6 dobbelttimer, men forventes dog at have haft en vis indflydelse pi fors0gs- 
resultateme. Fors0gene med finske studenter fandt sted pi Dalum 
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Landbrugsskole og i et kontor Scandinavian Area Studies, Odense 
Universitet. Gruppen af danske fors0gspersoner gennemgik oftest fors0gene i 
private hjem i hhv. Odense og Svendborg. Et fors0g tog i gennemsnit 25 >3 5 
minutter. 

Fors0gspersoner 

Alle fors0gspersoneme udfyldte et registreringsskema. De oplysninger, der 
bar relevans for fors0g med KP, er f0rst og fremmest fors0gspersonens 
nationalitet, modersmal, k0n og alder^^. 

For at deltage i fors0get skulle fors0gspersoneme vaere i besiddelse af en 
normal h0relse - dvs. de matte ikke have fdet konstateret en vaesentlig nedsat 
h0relse eller andre h0reskader. 



Fordeling af nationalitet og kon 




Danske fp. 

Figur 2.2.11 

I fors0get deltog i alt 57 fors0gspersoner fordelt pa 41 danskere og 16 finner, 
42 kvinder og 15 maend i alderen 12 - 61 ir (gennemsnitsalderen var 28 ir). 
Ingen af fors0gspersoneme medvirkede flere gange. 



Af registreringsskemaet fremgik det, at jeg udelukkende ville anvende fors0gspersonemes 
initialer. Desvaerre havde jeg ikke forudset, at der ville vaere en raekke sammenf^d, hvorfor 
jeg matte anvende forkortelser bestaende af 3 bogstaver (oftest de to f0rste bogstaver i 
fomavnet samt f0rste bogstav i eftemavnet). 
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Som det fremgir af figur 2.2.11, var der blandt de finske fors0gspersoner en 
stor overvaegt af kvinder, hvorimod de danske fors0gspersoner var mere lige- 
ligt fordelt over de to k0n. 

OgsS aldersmaessigt udgjorde de finske fors0gspersoner en konform gruppe: 
af de 16 finske deltagere var 15 (93,75 %) i alderen 21 - 25 Sr (gennemsnits- 
alderen var 23,6 ar). Gruppen af danske fors0gspersoner var med en 
gennemsnitsalder pa 32,5 ar lidt aeldre, men havde en langt st0rre alders- 
maessig spredning (12 - 61 Sr), jf figur 2.2.12. 



Aldersfordelingen Aldersfordelingen 

hos de danske fp. hos de finske fp. 




11 - 16 - 21 - 26 - 31 - 36 - 41 - 46 - 51 - 56 - 61 - 16 - 21 - 26 - 31 - 36 - 41 - 46 - 51 - 56 - 61 - 

15 20 25 30 35 40 45 50 55 60 65 15 20 25 30 35 40 45 50 55 60 65 

Alder Alder 



Figur 2.2.12 



Det var ikke alle fors0gspersoner, der responderede pS samtlige 4 testserier - 
enkelte deltagere sprang fra efter kun at have gennemgSet ^n af de to 
hovedkategorier, konsonantidentifikation og -diskrimination eller vokal- 
identifikation og -diskrimination. Hvis en deltager f.eks. havde gennemgSet 
praesentationsserie 'C-Iden-T, skulle vedkommende derefter gennemgS ’C- 
Disk-T - og evt. 'V-Iden-1* og 'V-Disk-1*. Jeg fors0gte desuden at fordele 
det samlede antal fors0gspersoner over de 5 varianter af hver praesentations- 
serie. FormSlet var naturligvis at undgS bias determineret af raEkkef0lgen i 
praesentationsserieme, jf. figur 2.2.13. 
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Fordelingen af praesentationsserier 




Serie 1 Serie 2 Serie 3 Serie 4 Serle 5 



Figur 2.2.13 

Hvis man ser bort fra parametrene nationalitet, k0n og alder, er de to grupper 
af fors0gspersoner sammenlignelige: de er blevet prassenteret for de samme 
akustiske stimuli under ensartede forhold. 



Danske fp: 
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KAS er fra Estland og burde derfor behandles separat fra de finske fors0gspersoner, men 
da hendes fors0gsresultater stemmer belt overens de finske, bar jeg valgt at beban^e de 
to grupper samlet. 

o 
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Figur 2.2.14 
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2.3 Resultater fra fors0g med kategorisk 
perception: et S-T-D-kontinuum 

Det er min hensigt i det f0lgende at praesentere resultater fra fors0g med KP 
af et akustisk S-T-D-kontinuum, der udelukkende varierer mht. VOT. 
Resultateme stammer fra to grupper fors0gspersoner, 40 danske og 16 finske. 

Desuden vil jeg analysere de praesenterede data for at finde ud af, om de 
opfylder kriterieme for KP - og ikke mindst i hvilken grad. Senere vil jeg 
endvidere analysere resultateme med henblik pa de opstillede hypoteser i 
kapitel 2.2: Fors0g med kategorisk perception, nemlig motorhypotesen, 
hypotesen om sprogspecifikke kategorigraenser og hypotesen om stimulus- 
asymmetri. 

Identifikation af stimuli fra et VOT-kontinuum 

De f0rste resultater, jeg vil praesentere, er fra de 4 identifikationsserier, hvor 
fors0gspersoneme 2 gange skulle identificere hver af de 14 stimuli som enten 
'dale', 'sale' eller 'tale'. 

Gruppen af danske fp bestod af 40 personer, der er blevet praesentere! for 
hver stimulus 2 gange, hvilket betyder, at procentfordelingen i figur 2.3.1 er 
baseret pa 1.120 praesentationer og reaktioner (40 • 14 • 2). 



Fp: 40 danskere 




Figur 2.3.1 



Det fremgar tydeligt af den trimodale (trepuklede) fordeling, at fors0gs- 
personeme har kunnet identificere alle stimuli som tilh0rende en af de tre 
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sproglige kategorier, 'S, T eller 'D. Fors0gspersonerne har f.eks. ikke 
tilskrevet det akustiske kontinuum blot to kategorier. En platykurtisk 
fordelingsform - dvs. med "brede" kategoritoppe - kombineret med den h0je 
identifikationsprocent er endvidere en god indikator for, at stimuli har virket 
relativt naturlige. Havde fors0gspersoneme oplevet mange stimuli som 
"unaturlige", f.eks. som en mellemting mellem to forskellige sproglyde, ville 
forskellen mellem de tre fordelingskurver vaere meget mindre, hvilket ville 
betyde en lavere og fladere fordeling omkring 50% percentilen. 

I histogrammet over de finske fors0gspersoners identifikation af samme 
VOT-kontinuum, figur 2.3.2, finder vi samme h0je identifikationsprocent og 
fordelingskurtose som i det danske. 

Gruppen af finske fp bestod af 16 personer, der ligeledes blev praesenteret for 
hver stimulus 2 gange, hvilket gav i alt 448 praesentationer og reaktioner (16 • 
14 • 2). 



Fp; 16 tinner 




Figur 2.3.2 



Ser vi naermere pS, hvordan de to grupper har tilskrevet kategorier til det 
akustiske kontinuum, traeder nogle forskelle frem. Hvis vi udelukkende 
fokuserer pa de observationsvaerdier, der overstiger 50% percentilen*, kan vi 
se, at de danske fors0gspersoner har tilskrevet stimulus 1-4 til kategorien 'S, 
5-10 til T og 11-14 til *D, hvor de finske fors0gspersoner har tilskrevet 
stimulus 1-6 til 'S, 7-10 til T og 11-14 til 'D. De danske fors0gspersoner har 



* 50% percentilen i figur 2.3.1 og 2.3.2 er ikke udtryk for medianen, da koordinateme (i 
horisontalt perspektiv) ikke er normalfordelte (Petersen 1995). 
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altsi en mindre S-kategori og en st0rre T-kategori end de finske 
fors0gspersoner. 

Statistiske analyser 

Nu kunne det vaere godt at vide, om kategoritilskrivningen kan vaere opstiet 
ved tilfaeldighed: alt andet lige er der jo 33% sandsynlighed for, at en 
stimulus tilskrives 6n af de 3 kategorier. Det er altsa vigtigt, hvor stor sand- 
synligheden er for netop den konkrete kategoritilskrivning. For at besvare 
dette sp0rgsmil har jeg opstillet en s^aldt ’nul-hypotese’, Hq, der skal afsl0re 
sandsynligheden for, at en given stimulus ikke identificeres som tilh0rende en 
given kategori pi basis af de to populationer, danske identifikationer og finske 
identifikationer. 

Sandsynlighed for Hq for hver enkelt stimulus fremgar af P-vaerdieme i figur 
2.3.3 Sandsynligheden er beregnet ud fra forholdet mellem observations- 
vaerdien (n), populationens aritraetiske middelvaerdi (X) og standard-afvigelse 
(S) set i forhold til en normalfordeling (den gaussiske fordeling). 
Sandsynligheden for Hq er ved enkelte stimulus si lav, at den ikke indgir i 
min normalfordelingstabel (P som funktion af Z) (Petersen 1995). Disse 
sandsynligheder (P < 0,001) er i figur 2.3.3 markeret med tre stjemer (***). 
Hq(P < 0,05) - dvs. en statistisk signifikant fordeling - er derimod markeret 
med 6n stjeme (*). 
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Population: finske 
Kategori: S 



fors0gspersoners identifikationer 
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Figur 2,3.3 



Som det fremgar af figur 2.3.3 er bade danske og finske fors0gspersoners 
identifikationer statistisk signifikante (dvs. P < 0,05) i 12 tilfaelde (markeret 
men de statistisk signifikante identifikationer er fordelt pk forskeliige 
stimuli: hos danske fors0gspersoner er stimulus 1-3 identificeret som S, 6-10 
som T og 11-14 som D, hvor finske fors0gspersoner bar identificeret 
stimulus 1-5 som S, 7-10 som T og 12-14 som D. 



Vi kan forel0bigt konkludere f0lgende: 
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1) De finske fors0gspersoner tilskriver faerre stimuli til 'D end de danske 
fors0gspersoner, f.eks. identificeres stimulus 11 ikke konsekvent som D af 
finske, men af danske fors0gspersoner. 

2) De finske fors0gspersoner tilskriver faerre stimuli til 'T end de danske 
fors0gspersoner, f.eks. identificeres stimulus 6 ikke konsekvent som T af 
finske, men af danske fors0gspersoner. 

3) Omvendt tilskriver de finske fors0gspersoner langt flere stimuli til 'S end 
de danske fors0gspersoner, f.eks. identificeres stimulus 4 og 5 som S af de 
finske fors0gspersoner, hvorimod de danske fors0gspersoner oftere 
identificerer stimulus 5 som T. 

Det, vi forel0bigt har kunnet sige om danske og finske fors0gspersoners 
identifikation af samme akustiske VOT-kontinuum, bygger pk data, der er 
statistisk signifikante, dvs. Hq(P < 0,05). 

Nu kunne det vaere godt at vide, hvor signifikante de signifikante data er, og 
hvor langt de insignifikante data er fra at vasre signifikante. Er de 
insignifikante identifikationer — f.eks. de finske identifikationer af stimulus 1 1 
eller danske identifikationer af stimulus 4 og 5 - fuldstaendig tilfaeldige eller 
er de relativt taet ved at vaere signifikante? Dette sp0rgsmal har jeg fors0gt at 
besvare ved at sammenligne antallet af identifikationer for hver stimulus med 
graensen for hvor fk identifikationer . der skal til for Hq med hhv. P < 0,05, P 
< 0,01 og P < 0,001 (jf- figur 2.3.4). 
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10 11 12 13 14 





Resultater fra fors0g med kategorisk perception: et S-T-D-kontinuum 



Finske fp: Identifikationens signifikans 




1 2 3 4 5 6 7 8 9 10 1 1 12 13 14 

Stimuli 



Figur 2.3.4 

Som vi nu kan se (i figur 2.3.4) adskilles de tre kategorier 'S, T og ’D ved 
relativ skarpe graenser; der er altsa ikke bare tale om glidende overgange fra 
kategori til kategori over adskillige stimuli, hvilket ville have resulteret i 
"fladere", b0lgeformede signifikanskurver. Vi kan altsa med al rimelighed 
sige, at identifikationsadfaerden hos danske og finske fors0gspersoner 
afspejler kategorier med skarpe graenser og ikke prototypekategorier med 
gradueret medlemskab (Lakoff 1987; Rosch 1981). 

Hvis vi udelukkende fokuserer pd de skarpt afgraensede kategorier, ser vi, at 
de fordeler sig forskelligt hos de to fp-grupper: 
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Figur 2.3.5 



Set i forhold til VOX, der jo er den varierende faktor i det akustiske 
kontinuum, som de to grupper er blevet praesenteret for, fremgar det, at den 
finske D-kategori bestir af stimuli med VOX under 25 ms, hvorimod den 
danske D-kategori inkluderer stimulus 11 med VOX pa 25 ms. Samme VOX- 
forskydning finder vi i de to X-kategorier: igen inkluderer den danske 
kategori stimuli med h0jere VOX end den tilsvarende finske kategori. 
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Figur 2.3.6 
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Sammenligner vi de to fp-gruppers S-kategorier, opdager vi, at de f0lger det 
overordnede m0nster: finske kategorier inkluderer stimuli med lavere VOX 
end de korresponderende danske kategorier. Forel0big tyder alt altsa pS, at 
kategorigraenseme er sprogspecifikke, dvs. betinget af en strukturering af det 
akustiske VOT-kontinuum pa et konkret sprog. 

Ovenstaende resultater svarer ganske godt til mine forventninger. Det 
forholder sig nemlig sadan, at den fonetiske kontrast mellem [d] og [t] er 
markeret pa forskellig made pa hhv. finsk og dansk. Som tidligere beskrevet 
(side 52ff) adskiller dansk [d] og [t] sig fra hinanden udelukkende ved 
aspiration; hvor [d] er uaspireret, er [t] kraftigt aspireret. Heroverfor er bade 
det finske [d] og [t] uaspireret. Derimod er kontrasten markeret ved en 
forskel i stemthed; pa finsk er [d] en stemt 1yd og [t] en ustemt 1yd. 

Nar de finske fors0gspersoner udelukkende identificerer stimuli med ganske 
kort VOX som D, sky Ides det netop, at varigheden af friktionsst0j f0r VO 
ikke mi overskride varigheden af den eksplosionsst0j, der er en naturlig f0lge 
af artikulationsorganemes "traeghed" - ofte indledes selv stemte sproglyde af 
en kortvarig eksplosionsfase, hvilket giver VO over 0 ms. 

Omvendt overrasker det mig, at de finske fors0gspersoner har identificeret 
stimuli med en relativ lang VOX som tilh0rende 'X. Det var egentlig min 
forventning, at det ustemte og uaspirerede [t] pa finsk i h0jere grad 
korresponderede med nogle af de stimuli, som danske fors0gspersoner har 
identificeret som D, der pi dansk ligeledes er ustemt og uaspireret. Nir dette 
ikke er tilfaeldet, skyldes det sandsynligvis, at de fonetiske termer ’stemthed’ 
og 'aspiration' daekker over en relativ stor variation i konkrete 
manifestationer. 

Diskrimination af stimuli fra et VOT-kontinuum 

Nu er det vaesentligste kriterium for kategorisk perception ikke 
identifikationen alene, men dens relation til diskriminationen af samme 
stimuli. Data fra en lang raekke fors0g med KP viser dog, at der sjaeldent er 
tale om ideel kategorisk perception, dvs. en diskriminationsadfaerd, der 
udelukkende er betinget af kategoriseringen. Oftest er diskriminationen af 
stimuli fra samme kategori simpelthen bedre end Haskins-modellens 
forudsigelser. 
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Ovenstiende analyse af resultater fra identifikationsserieme afsl0rer et 
markant skifte i identifikationen som funktion af VOT. Pi baggrund af disse 
resultater forventer jeg at finde en tilsvarende god diskrimination af stimuli 
fra forskellige kategorier, dvs. med en maksimal diskrimination ved kategori- 
graenseme, samt en markant ringe diskrimination af stimuli fra sanune 
kategori. 

Figur 2.3.7 nedenfor bygger pi resultater fra de 4 diskriminationsserier, 
hvor fors0gspersoneme skulle vurdere om to praesenterede (nabo-)stimuli var 
ens eller forskellige (se beskrivelsen af diskriminationsserier og procedure 
side 67ff). 





s a ^ (a 'K <t> ^ ^ ^ ^ 

S'T'D'kontInuum 



Figur 2.3.7 

Gruppen af danske fp bestod af 40 personer, der hver 40 gange skulle afgive 
en 'ens/forskellige'-vurdering af de praesenterede stimuli, hvilket betyder, at 
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fordelingen i figur 2.3.7 er baseret pa 1.600 praesentationer og vurderinger 
(40 • 40). 

Den finske fp-gruppe bestod af 16 personer, der ligeledes skulle afgive hver 
40 'ens/forskellige'- vurderinger, hvilket gav i alt 640 praesentationer og 
vurderinger (16 • 40). 

Som det med al tydelighed fremgar af figur 2.3.7 er der en naer korrelation 
mellem identifikationen og diskriminationen (begge som funktion af VOX). 
For det f0rste er diskriminationen af stimuli fra samme kategori meget lav. 
Den hdjeste diskriminationsprocent mellem stimuli fra samme kategori er hos 
de danske fors0gspersoner 36% (mellem stimulus 3 og 4), dvs. et ringere 
udfald end hvis fors0gspersoneme havde slaet plat og krone^. Derimod er den 
tilsvarende h0jeste diskriminationsprocent hos de finske fors0gspersoner lidt 
h0jere, nemlig 66% (mellem stimulus 11 og 12). 

For det andet kan vi konstatere en relativ god diskrimination af stimuli fra 
forskellige kategorier - dvs. ved kategorigraenser og -overgange. Hos de 
danske fors0gspersoner kan vi notere en diskriminationsprocent belt oppe pa 
88% (mellem stimulus 10 og 11), hvilket betyder, at de i knapt 9 ud af 10 
praesentationer har kunnet h0re forskel pa stimuli varierende med 10 ms 
VOX. De to diskriminationstoppe stemmer meget godt overens med de 
tidligere anslJede kategorigraenser ved hhv. stimulus 4-5 (VOX i ms: 95/85) 
og stimulus 10-11 (VOX i ms: 35/25). Begge diskriminationstoppe er naermest 
prototypiske eksempler pk faenomenet ’kategorisk effekt'. 

De finske fors0gspersoner har ligeledes haft lettest ved at skelne mellem 
stimulus 10 og 1 1 - dog kun i 69% af praesentationeme. Den anden kategori- 
graense, der ligeledes er manifesteret ved en diskriminationstop, findes som 
forventet mellem stimulus 6 og 7 (VOX i ms: 75/65). Begge diskriminations- 
toppe er igen glimrende eksempler pa den kategoriske effekt. 

Der er altsa ingen tvivl om, at vi pk grundlag af disse data kan konkludere, at 
sSvel de danske som de finske resultater afspejler kategorisk perception. 



^ Og her har jeg endda medregnet stimuli, hvis identifikation er signifikant ved P < 0,05 og 
ikke kun de skarptafgraensede kategorier med P < 0,001. 
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Statistiske analyser 

Hvis vi herefter udelukkende fokuserer pk diskriminationen af stimuli, der er 
signifikante med P < 0,001, trader et endnu klarere m0nster frem. I figur 
2.3.8 har jeg sammenholdt de to fp-gruppers identifikationer, 
identifikationemes signifikansgranse for Hq(P < 0,001) samt diskrimination. 
Den stiplede signifikanskurve for P < 0,001 afgranser de 10 mest signifikante 
stimuli, som jeg for overskuelighedens sky Id har markeret med store 
firkantede koordinater. 



Fp: 40 danskere 





Figur 2.3.8 



De 10 stimuli, der fordeler sig over tre kategorier, er ikke alene meget 
signifikante, men ogsi de svareste at diskriminere. Hos de danske fors0gs- 
personer har de 10 mest signifikante stimuli de laveste diskriminations^ 
procenter med 28% som det maksimale, jf. de markerede punkter p^ 
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diskriminationskurven. Det er isaer vaerd at laegge maerke til den pafaldende 
stigning i diskrimination af stimulus 13 og 14, hvilket sky Ides, at dette 
interval overskrider stemthedsgraensen ved 0 ms VOX. 

Hos den finske fp-gruppe udg0r de 10 mest signifikante stimuli ligeledes 
raekken af stimuli, der er svaerest at diskriminere - dog med en enkelt 
undtagelse: diskriminationen af stimulus 7 og 8 er pa 19% - altsa lavere end 
mellem f.eks. 3 og 4, 9 og 10, 12, 13 og 14 - hvilket sandsynligvis skyldes, at 
stimulus 8 er signifikant med P < 0,001 og stimulus 7 med P < 0,01. Som det 
fremgar af de markerede punkter pS diskriminationskurven er den maksimale 
diskriminationsprocent for de mest signifikante stimuli pa 31% . 

Som ovenstSende analyser illustrerer, afspejler bSde danske og finske 
resultater kategorisk perception. Den bedste indikator for KP finder vi i den 
kategoriske effekt, dvs. diskriminationstoppene mellem kategorier. 

Perspektivering af resultater 

Sp0rgsmSlet om hvorvidt den kategoriske effekt skyldes en psykoakustisk 
taerskel eller sprogspecifik fonetisk kategorisering kan ikke besvares ^ntydigt. 
Det er dog belt sikkert, at fors0gspersonens modersmal har en meget stor 
indflydelse pk savel identifikationen som diskriminationen af stimuli fra et 
VOT-kontinuum. Det fremgar klart af resultateme, at de to fp-grupper 
strukturerer det akustiske kontinuum forskelligt - belt i overensstemmelse 
med de fonetiske forskelle pa de to sprog. 

Omvendt kan fonetisk betinget kategorisering ikke forklare alle faenomener: 
f.eks. er den 0gede diskrimination af stimulus 13 og 14 hos de danske 
fors0gspersoner ikke betinget af en fonetisk stemthedskontrast pa det 
pSgaeldende sprog. PS trods af at stemthedsgraensen (0 ms VOX) ikke indgar i 
den danske strukturering af udtrykssubstansen, er de danske fors0gspersoner i 
stand til at skelne mellem stimulus 13 og 14 med hhv. +5 ms VOX og -5 ms 
VOX i 28% af tilfaeldene. Selvom sprogperceptionen i h0j grad er betinget af 
sprogspecifikke kategorier, er der altsa ikke belaeg for at ga sa langt som til at 
sige, at: 

"...discrimination is limited by identification: subjects can only discriminate between stimuli 
that they identify differently" (Studdert-Kennedy, Liberman, Harris & Cooper 1970: 234). 
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En anden problemstilling, jeg bar fors0gt at belyse i dette fors0g med KP, er 
sp0rgsmalet om, hvorvidt der eksisterer en nser sammenhaeng mellem 
artikulation og perception, som postuleret af Haskins-gruppen o.a. If0lge 
Haskins-modellen udspringer sprogproduktion og sprogperception af samme 
saet artikulatoriske kommandoer. Hvis denne antagelse er korrekt, medf0rer 
det, at sprogbrugere ikke bar adgang til information ud over de fonetiske 
kategorier, dvs. at fonetiske kategorier, der adskiller sig ved diskrete 
artikulatoriske egenskaber, perciperes som absolutte, diskrete st0rrelser, 
bvorimod perceptionen er kontinuerlig, nar kontinuerlig artikulatorisk 
variation er mulig. 

Artikulatorisk kontinuitet er efter min opfattelse ikke altid et sp0rgsmal om 
*enten-eller’, men ’mere’ eller ’mindre’. F.eks. kan artikulationen kaldes 
kontinuerlig, bvis en sprogbruger er i stand til at producere vokallyde, der 
udg0r forskellige kvaliteter mellem f.eks. et [ae] og et [a]. Omvendt er den 
artikulatoriske overgang mindre kontinuerlig ved produktionen af sproglyde, 
der udg0r overgange fra et [t] til et [d] - ber bar danske sprogbrugere langt 
svaerere ved at producere tilsvarende sma forskelle - men slet ikke lige si 
diskontinuerlig som overgangen fra f.eks. et [t] til et \pf. Set i dette 
perspektiv udg0r de tre fonetiske kategorier, som indgar i dette fors0g, bbv. 
en artikulatorisk diskontinuerlig overgang fra [s] til [t], men ogsa en overgang 
fra [t] til [d], der bverken er absolut diskontinuerlig eller kontinuerlig. 

Med afsaet i synteseteoriemes antagelse om at KP afspejler menneskers 
artikulatoriske potentiale, kan vi redefinere motorbypotesen, si den tager 
bensyn til den beskrevne graduering af ’artikulatorisk kontinuitet': jo mindre 
artikulatorisk kontinuerlige sproglydene er, desto st0rre kategorisk effekt vil 
de udvise - og st0rre kontinuitet vil resultere i mindre kategorisk effekt. 
Fordelen ved denne redefinition er, at motorbypotesen nu kan opstilles, si den 
er empirisk falsificerbar: Hvis artikulatorisk kontinuitet er den eneste faktor, 
der betinger KP, vil diskriminationen af akustisk diskontinuerlige stimuli 
vaere bedre end af akustisk kontinuerlige stimuli. Ser vi naermere pi de 
danske fors0gspersoners evne til diskrimination, jf. figur 2.3.8, viser det sig, 
at den maksimale diskriminationsprocent mellem de artikulatorisk dis- 



^ Jeg har altsi valgt at fortolke begrebet 'artikulatorisk kontinuitet’ som evnen til at producere 
sproglyde, der udgpr overgange mellem to fonetiske kategorier. Det er dog ogsa muligt at 
haevde, at 'artikulatorisk kontinuitet’ bestir i muligheden for at producere en sproglyd, der i 
sig selv udg0r en artikulatorisk overgang mellem fonetiske kategorier. Der er nok ingen tvivl 
om, at Has&ns-gruppen henviser til sidstnaevnte definition. 
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kontinuerlige kategorier 'S og T er 45%, altsa vaesentlig lavere end den 
maksimale diskrimination pa 88% mellem kategorieme T og 'D, der er mere 
artikulatorisk kontinuerlige. 

Der er altsa ikke hjemmel i mine empiriske data for at haevde en en-til-^n 
relation mellem artikulation og perception. Selvom data fra de to fp-grupper 
klart afspejler kategorisk perception, ville en perception udelukkende baseret 
pa artikulatoriske kommandoer have givet et belt andet billede. For det f0rste 
ville identifikationsfunktionen for hver stimulus have vaeret enten 100% eller 
0%. For det andet - og her finder vi den st0rste afvigelse - ville 
diskriminationen af stimuli fra to artikulatorisk diskontinuerlige kategorier 
have vaeret 100% og ikke 45%. Endelig skulle fors0gspersoneme ikke have 
adgang til information ud over de fonetiske kategorier, hvilket betyder, at 
diskriminationen af stimuli fra samme kategori ville vaere pa 0% og ikke oppe 
pS 28%, som vi kan notere hos de danske fors0gspersoner. Fors0gs- 
personeme mS altsa ogsi have mulighed for at benytte anden information end 
de postulerede artikulatoriske kommandoer. 
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2.4 Resultater fra fors0g med kategorisk 
perception: et I-E-^-A-kontinuum 

I det f0lgende vil jeg praesentere resultateme fra den del af fors0get med KP, 
der involverer et akustisk vokalkontinuum. De praesenterede stimuli er 
syntetisk produceret med varierende FI og F2 (se beskrivelsen af stimuli side 
59ff). Resultateme bygger pa identifikations- og diskrimi nations adfaerd hos 
de tidligere omtalte fp-grupper, jf. side 7 Iff. 

De er min hensigt at praesentere resultateme i samme raekkef0lge, som jeg 
praesenterede resultateme fra fors0g med et VOT-kontinuum. De f0rste 
resultater, jeg vil gennemga, er de to fp-gruppers identifikation af stimuli. 
Disse resultater vil jeg analysere med samme statistiske metoder som blev 
anvendt i analysen af konsonantidentifikationer i foregiende kapitel. Derefter 
vil jeg praesentere resultateme fra diskriminationsserieme og analysere deres 
forhold til identifikationen for at finde ud af, om de samlet opfylder 
kriterieme for KP. 

Endelig vil jeg perspektivere resultateme med henblik p^ de opstillede 
hypoteser i kapitel 2.2: Fors0g med kategorisk perception, nemlig motor- 
hypotesen, hypotesen om sprogspecifikke kategorigraenser og hypotesen om 
stimulusasymmetri. 

Identifikation af stimuli fra et formantkontinuum 

De f0rste resultater, jeg vil praesentere, er fra de 4 identifikationsserier, hvor 
fors0gspersoneme skulle identificere de 19 praesenterede stimuli som enten 
•A’, ’E’, T eller ’/E’. 

Den danske fp-gruppe bestod i dette fors0g "kun" af 39 personer (jf. fp- 
oversigten side 73 ff). Foirs0gspersoneme blev i dette fors0g praesenteret for 
en identifikationsserie best^ende af 19 praesentationer, hvilket betyder, at 
procentfordelingen i figur 2.4.1 er baseret pa 741 praesentationer og 
identifikationer (39 • 19). 

Som fordelingskurven tydeligt illustrerer, bar fors0gspersonerne kunnet 
identificere stimuli som tilh0rende en af de fire kate gorier, 'I, 'E, 'JE eller 
'A. Den leptokurtiske fordeling, dvs. en mere spids fordelingstop end ved 
normalfordelingen, antyder, at fors0gspersoneme kun bar fundet et lille antal 
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Stimuli egnet som eksempler pS naturlige vokalmanifestationer. Omvendt har 
disse stimuli udgjort "gode" eksempler, for de er blevet tilskrevet samme 
kategori hver gang. 



Fp: 39 danskere 




123456789 10 1 1 12 13 14 15 16 17 18 19 
l-E^/E-A-kontlnuum 



Figur 2.4.1 

I histogrammet over de fmske fors0gspersoners identifikation af samme 
akustiske kontinuum, figur 2.4.2, finder vi samme h0je identifikationsprocent, 
men en anden fordelingskurtose end i det danske. Den platykurtiske 
fordelingsform i det finske diagram antyder, enten at de fmske kategorier 
daekker st0rre frekvensomrSder, eller at de finske fors0gspersoner er mere 
fonetisk fleksible end de danske. 



Fp: 16 tinner 




1 2 3 4 5 6 7 8 9 10111213141516171819 

l-E-ZE-A-kontinuum 



Figur 2.4.2 
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Gruppen af finske fors0gspersoner bestod af de samme 16 personer, som 
indgik i fors0get med konsonantstimuli. De 16 finske fors0gspersoner blev 
ligesom de danske praesenteret for de 19 syntetiske stimuli, som de skulle 
identificere med afsaet i deres eget modersmal. Procentfordelingen i figur 
2.4.2 er altsa baseret pa 304 praesentationer og identifikationer (16 • 19). 

Som det fremgar af fordelingskurven har de finske fors0gspersoner kun 
identificeret de praesenterede stimuli som I, E og A - ikke /E. Dette skyldes, 
at der kun eksisterer tre urundede fortungevokaler pa finsk, et [i] og et [e], 
der begge artikuleres med lidt st0rre abningsgrad end de tilsvarende danske. 
Desuden har fmsk - som i dansk - to a-varianter, en urundet fortungevokal, 
der er en anelse mere Sbne end det danske [a:] (som f.eks. i ’abe’) og en 
bagtunge variant. 

Som f0lge af denne forskydning mellem de danske og de finske vokallyde 
opstod der (uventet) variation i de finske valg af respons. Nogle af de finske 
fors0gspersoner valgte en skrift-til-lyd strategi, sa det danske vokalbogstav 
’ae’ repraesenterede den finske fortungevokal og 'a' bagtungevokalen. Hos 
disse fors0gspersoner blev det syntetiske vokalkontinuum tilskrevet de tre 
kategorier 'I, ’E og 'JB, hvorimod 'A blev udeladt. Andre af de finske 
fors0gspersoner valgte derimod en lyd-tiMyd strategi med 'a' som 
repraesentation for den finske fortungevokal. Hos disse fors0gspersoner blev 
ingen af de praesenterede stimuli altsa tilskrevet kategorien '/E. For at undgS 
at inddrage fire finske kategorier af urundede fortungevokaler, hvor der 
faktisk kun eksisterer tre, har jeg valgt at se bort fra forskellen mellem 
respons med ’ae’ og respons med 'a'. De to fiktive kategorier 'JE og 'A har jeg 
altsS slSet sammen til 6n kategori, der repraesenteres ved et 'A'. 

Ser vi pj, hvordan de to fp-grupper har tilskrevet kategorier til det akustiske 
kontinuum, traeder der nogle klare forskelle frem. Hvis vi udelukkende 
fokuserer pa de observationsvaerdier, der overstiger 50% percentilen* (jf. 
figur 2.4.1 & 2), kan vi se, at de danske fors0gspersoner har tilskrevet 
stimulus 1-6 til kategorien ’I, 7-10 til ’E, 11-17 til 'JE og 18-19 til 'A. 
Tilsvarende har de finske fors0gspersoner tilskrevet stimulus 1-8 til 'I, 9-15 
til ’E og 17-19 til ’A. 

* 50% percentilen er, som omtalt i note 1, side 77, ikke udtryk for medianen (Petersen 1995). 
Vi fokuserer her udelukkende pa de observationsvaerdier, der overstiger 50% percentilen, 
hvilket ekskluderer de finske identifikationer af stimulus 16, der i praecis 50% af tilfaeldene er 
blevet identificeret som E og i de andre 50% som A. 
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De danske fors0gspersoner har altsS kategorier, der generelt inkluderer faerre 
stimuli end de finske fors0gspersoner. En af arsageme til dette er naturligvis, 
at det akustiske kontinuum straekker sig over fire danske kategorier, men kun 
tre finske. En anden mulig Srsag er, at de finske fors0gspersoner accepterer 
langt st0rre variation, f0rst og fremmest i E-kategorien. De meget skarpe 
kategorigraenser i det finske histogram - f0rst og fremmest mellem ’I og ’E - 
tyder pa en h0jere grad af kategorisk perception end det danske diagram 
indikerer. 

Statistiske analyser 

Lad os nu se pa, om kategoritilskrivningen kan vaere opstaet ved en 
tilfaeldighed: alt andet lige er der 25% sandsynlighed for, at de danske 
fors0gspersoner har identificeret en vilkarlig stimulus som tilh0rende ^n af de 
fire kategorier. Tilsvarende er der 33% sandsynlighed ved de finske 
identifikationer, der jo indbefatter tre kategorier. 

Pi samme made som i analyseme af konsonantidentifikationer har jeg opstillet 
en statistisk ’nul-hypotese’, nemlig at en given stimulus ikke identificeres som 
tilh0rende en given kategori. Sandsynlighed for for hver enkelt stimulus 
fremgar af P-vaerdieme i figur 2.4.3. Sandsynligheden er beregnet ud fra 
forholdet mellem observation svaerdien (n), populationens aritmetiske 
middelvaerdi (X) og standardafvigelse (S) set i forhold til en normalfordeling 
(den gaussiske fordeling). Sandsynligheden for Hq er ved nogle stimuli si lav, 
at den ikke indgir i min normalfordelingstabel (med P som funktion af Z) 
(Petersen 1995). Disse sandsynligheder (P < 0,001) er i figur 2.4.3 markeret 
med tre stjemer (***). Hq(P < 0,05), dvs. en statistisk signifikant fordeling, 
er derimod markeret med stjeme (*). 

Population; danske for$0gspersoner$ identifikationer 
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Resultater fra fors0g med kategorisk perception: et I>E-yE-A-kontinuum 




Population: finske forsogspersoners identifikationer 
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Resultater fra fors0g med kategorisk perception: et I-E-^-A-kontinuum 
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Figur 2.4.3 



Som det fremg^ af figur 2.4.3 er b^de danske og finske fors0gspersoners 
identifikationer statistisk signifikante (dvs. P < 0,05) i 15 tilfaelde (markeret 
*), men de statistisk signifikante identifikationer er fordelt pa forskellige 
stimuli: hos danske fors0gspersoner er stimulus 1-5 identificeret som I, 7-10 
som E, 13-16 som JE og 18-19 som A, hvor finske fors0gspersoner bar 
identificeret stimulus 1-7 som I, 9-14 som E og 18-19 som A. 

Vi kan forel0big konkludere f0lgende: 

1) De danske fors0gspersoner tilskriver faerre stimuli til 'I end de finske 

fors0gspersoner, f.eks. identificeres stimulus 6 ikke konsekvent som I af 
danske, men af finske fors0gspersoner. Endvidere identificerer danske 

fors0gspersoner stimulus 7 som E, hvorimod finske fors0gspersoner 
identificerer samme stimulus som I. Stimulus 7 indgar altsS i to forskellige 
kategorier pk de to sprog. 

2) De danske fors0gspersoner tilskriver ligeledes faerre stimuli til ’E end de 

finske fors0gspersoner, f.eks. identificeres stimulus 11 og 12 ikke som E af 
danske, men af finske fors0gspersoner. Endvidere identificerer danske 

fors0gspersoner stimulus 13 og 14 som JE, hvorimod finske fors0gspersoner 
identificerer de samme stimuli som E. Stimulus 13 og 14 indg^ altsi ogs^ i to 
forskellige kategorier pa de to sprog. 

3) Hvor de danske fors0gspersoner tilskriver stimulus 13-16 til 'JE, indgar 
denne kategori ikke i de finske identifikationer. Det lader til, at denne 
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kategori er blevet assimileret af ’E, da stimulus 13, 14 og 15 oftere bliver 
identificeret med E end A og stimulus 16 falder lige 50% percentilen. 

4) Endelig er der sammenfald mellem de to sproggruppers A-kategori; 
begge fp-grupper identificerer stimulus 18 og 19 som A. 

Det, vi forel0bigt bar kunnet sige om danske og finske fors0gspersoners 
identiflkation af samme akustiske Fl/F2-kontinuum, bygger pa data, der er 
statistisk signifikante, dvs. Ho(P < 0,05). 

Nu kunne det vaere godt at vide, hvor signifikante de signifikante data er, og 
hvor langt de insignifikante data er fra at vaere signifikante. Dette sp0rgsmal 
bar jeg fors0gt at besvare ved at sammenligne antallet af identifikationer for 
bver stimulus med graensen for bvor fS identifikationer, der skal til for 
med bbv. P < 0,05, P < 0,01 og P < 0,001 Qf. figur 2.4.4). 
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Som det fremgir af figur 2.4.4 adskilles de fire danske (1, 'E, og ’A) og 
tre finske kategorier (’I, 'E og ’A) ved relativt skarpe graenser, dvs., at for 
langt de fleste stimuli gaelder det, at de enten er inkluderet i eller ekskluderet 
af en given kategori. Der er altsS ingen kraftige tendenser til glidende 
overgange fra kategori til kategori, hvilket ville have resulteret i fladere 
signifikanskurver centreret omkring 50% percentilen. Hvis vi udelukkende 
ser pide stimuli, hvis identifikationer er signifikante med P < 0,001, dvs. de 
finske identifikationer af stimulus 1-6, 9-14 og 19, og de danske 
identifikationer af stimulus 1-4, 9, 14-15 og 19, traeder dettte m0nster blot 
tydeligere frem. I modsaetning til den forventede tendens til prototype- 
kategorier med gradueret medlemskab, afspejler identifikationsadfaerden hos 
danske og finske fors0gspersoner altsa relativt skarpe kategorigraenser. 

Generelt daekker de finske kategorier over et st0rre antal stimuli end de 
danske. Fokuserer vi pa antallet af stimuli, der omfattes af I- og E-kategorien 
med P < 0,001, bestir de finske kategorier af hhv. 2 og 5 flere stimuli end de 
danske. Derimod lader der til at vaere et sammenfald mellem den danske og 
den finske A-kategori, som kun omfatter stimulus 19. Arsagen til 
kategoriemes forskellige omfang pa de to sprog er naturligvis, at det samme 
akustiske kontinuum straekker sig over fire danske, men kun tre finske 
kategorier. 
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Figur 2.4.5 



Set i forhold til formantfrekvenseme, der jo er den varierende faktor i det 
akustiske kontinuum, fremgir det, at den finske I-kategori er karakteriseret 
ved andre formantfrekvenser end den tilsvarende danske kategori. Bide FI og 
F2 i det finske 'I daekker et st0rre frekvensomride end de tilsvarende danske 
formantfrekvenser: pi den ene side omfatter FI h0jere frekvenser og pi den 
anden side daekker F2 lavere frekvensomrader. En rimelig tolkning af disse 
akustiske oplysninger mi vaere, at finske fors0gspersoner identificerer 
vokallyde, der korresponderer med en mere iben kaebestilling og tilbage- 
trukket tungemasse end i det danske [i], som manifestationer af 1. 
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Figur 2.4.6 



Hvis vi sammenligner de to respondentgruppers E-kategorier traeder nogle 
endnu st0rre forskelle frem. Det danske ’E daekker her kun en lille del af det 
frekvensomr^de, der udg0r det finske ’E, nemlig den laveste FI og den 
h0jeste F2. Med andre ord har de danske fors0gspersoner kun (konsekvent) 
identificeret et [i], nhi de praesenterede vokallyde korresponderede med den 
mest lukkede og fremskudte manifestation af det finske 'E. 

Omvendt daekker den danske iE-kategori en stor del af de stimuli, som de 
finske fors0gspersoner identificerede som ’E’. Meget tyder altsS pk, at de 
formantfrekvenser, der udg0r det finske 'E, korresponderer med de to danske 
kategorier, ’E og 'JE. 

Diskrimination af stimuli fra et formantkontinuum 

Ovenst^ende analyse af resultater fra identifikationsserieme afsl0rer et 
markant skifte i identifikationen som funktion af varierende formant- 
frekvenser. Hvis vi udelukkende fokuserer pk identifikationsfunktionen, 
fremstir bSde danske og finske fors0gspersoners vokalperception som relativt 
kategorisk. Identifikationen er dog ikke det eneste - eller vaesentligste - 
kriterium for KP. KP er snarere kendetegnet ved, at fors0gspersoneme ikke 
kan skelne mellem flere stimuli end de kan identificere (Studdert-Kennedy et 
al. 1970). Med andre ord er den kategoriske effekt en n0dvendig - men ikke 
tilstraekkelig - betingelse for, at vi overhovedet kan tale om kategorisk 
perception af sproglyde, dvs., at vi kan registrere en maksimal diskrimination 
ved kategorigraenseme, samt en markant ringe diskrimination af stimuli fra 
samme kategori. 

Figur 2.4.7 nedenfor bygger pa resultater fra de 4 diskriminationsserier, 
hvor fors0gspersoneme skulle vurdere om to praesenterede (nabo-)stimuli var 
ens eller forskellige (se beskrivelsen af diskriminationsserier og procedure 
side 68ff), 
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Gruppen af danske fors0gspersoner bestod ligesom i identifikations0velsen af 
39 personer, der hver 55 gange skulle afgive en 'ens/forskellige’-vurdering af 
de praesenterede stimuli, hvilket betyder, at fordelingen i figur 2.4.7 er 
baseret pi 2.145 praesentationer og vurderinger (39 • 55). 

Den finske fp-gruppe bestod i alle fors0g af 16 personer, der ligeledes skulle 
afgive hver 55 ’ens/forskellige'-vurderinger, hvilket gav i alt 880 
praesentationer og vurderinger (16 • 55). 





Figur 2,4.7 



Som det fremgir af figur 2.4.7 er der kun i bedste fald tale om en ganske 
ringe korrelation mellem identifikationen og diskriminationen. 

For det f0rste er diskriminationen af stimuli fra samme kategori alt for god. 
Den h0jeste diskriminationsprocent mellem stimuli fra samme kategori udg0r 
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58% (mellem stimulus 8 og 9) hos de danske fors0gspersoner og 56% 
(mellem stimulus 10 og 11) hos de finske fors0gspersoner - begge over 
tilfaeldighedsgraensen pk 50%. 

For det andet kan vi konstatere, at diskriminationen af stimuli fra forskellige 
kategorier ikke afviger vaesentligt fra diskriminationen af stimuli fra samme 
kategori. Hos de danske fors0gspersoner kan vi notere en diskriminations- 
procent pi 69% (mellem stimulus 10 og 11) - kun 11% h0jere end ved 
diskrimination af stimuli fra samme kategori. Hos de finske fors0gspersoner 
udg0r den h0jeste diskrimination af stimuli fra forskellige kategorier kun 
59% (mellem stimulus 8 og 9), altsi naesten det samme som inden for samme 
kategori (56%). 

Pa trods af skarpe graenser mellem hhv. de danske og de finske vokal- 
kategorier er der altsi ikke tale om kategorisk perception, fordi 
identifikationsfunktionen ikke ledsages af en markant kategorisk effekt. 

Statistiske analyser 

Hvis vi herefter udelukkende fokuserer pi diskriminationen af stimuli, der er 
signifikante med P < 0,001, traeder et endnu klarere m0nster frem. I figur 
2.4.8 har jeg sammenholdt de to fp-gruppers identifikationer, 

identifikationemes signifikansgraense for Hq(P < 0,001) samt diskrimination. 
Den stiplede signifikanskurve for P < 0,001 afgraenser hhv. de 8 danske og 13 
finske signifikante stimuli, der er markeret med store firkantede koordinater. 



Fp: 39 danskere 
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Figur 2.4.8 

If0lge Haskins-modellen afspejles KP i en meget ringe diskrimination af 
stimuli fra samme kategori, men relativt god diskrimination af stimuli fra 
forskellige kategorier. 

De 8 stimuli, der fordeler sig over 4 danske kategorier, er ikke alene meget 
signifikante, men ogsS svaere at diskriminere. Som det fremgar af diagrammet 
finder vi netop den ringeste danske diskrimination mellem signifikante 
stimuli, nemlig 21% mellem stimulus 14 og 15. Tilsvarende udg0r den 
maksimale diskriminationsprocent af signifikante stimuli kun 33% (mellem 
stimulus 1 og 2). Omvendt er de signifikante stimuli ikke generelt de 
svaereste at diskriminere - faktisk har hele 6 par insignifikant kontrasterede 
stimuli en diskrimination mellem 21 og 33%. Der er altsS intet i de danske 
data, der indikerer en markant forskel i diskriminationen af stimuli fra hhv. 
forskellige kategorier og samme kategori. 



De 13 stimuli, der udg0r kemen i de 3 finske kategorier, er ligeledes svaere at 
diskriminere. Igen skal den laveste diskriminationsprocent findes ved 
diskrimination af signifikante stimuli, nemlig mellem stimulus 1 og 2, der kun 
er blevet diskrimineret i 16% af tilfaeldene. Den maksimale diskriminations- 
procent af signifikante stimuli (stimulus 10 og 11) er derimod belt oppe pS 
56%, hvilket er den naesth0jeste finske diskriminationsprocent. Heller ikke i 
de finske data er der indikationer for, at signifikante stimuli generelt er de 
svaereste at diskriminere - her har hele 7 par insignifikante kontrasterede 
stimuli en diskrimination mellem 16 og 56%. 



Som ovenstSende analyser illustrerer, afspejler hverken danske eller finske 
resultater kategorisk perception af vokallyde. Ganske vist adskilles de fire 
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danske (’I, ’E, 'JE og ’A) og tre finske kategorier (’I, ’E og ’A) ved relativt 
skarpe kategorigraenser, dvs. uden gradueret kategorimedlemskab, men de 
abrupte overgange i identifikationsfunktionen ledsages ikke af en markant 
kategorisk effekt, hvorfor identifikations- og diskriminationsadfaerden ikke 
kan betegnes som KP. 

Perspektivering af resultater 

I det fplgende er det min hensigt at sammenholde resultateme fra de 
praesenterede identifikations- og diskriminationsserier med hhv. hypoteser, 
der bar haft stor indflydelse pa fortolkningen af faenomenet ’kategorisk 
perception’, og mine egne forventninger til udfaldet af de enkelte delforspg. 

Hypotesen om stimulus-asvmmetri 

Stort set alle beskrivelser af faenomenet ’kategorisk perception’ bygger pa en 
generel, dikotomisk fremstilling med perceptionen af hhv. vokaler og 
konsonanter som to adskilte faenomener. Det haevdes almindeligvis, at 
lukkelyde kan fremkalde en kategorisk effekt, mens isolerede vokallyde 
diskrimineres lige godt eller ringe, hvad enten de tilh0rer samme eller 
forskellige fonetiske kategorier. 

Data fra langt de fleste empiriske underspgelser viser dog, at situationen er 
langt mere kompleks: For det fprste viser fors0g med KP sjaeldent ideel 
kategorisk perception, dvs. en diskriminationsadfaerd, der udelukkende er 
betinget af kategoriseringen. Oftest er diskriminationen af stimuli fra samme 
kategori simpelthen bedre end forventet (jf. side 49). For det andet viser 
unders0gelser med vokallyde praesenteret under varierede fors0gsbetingelser, 
at graden af kategorisk effekt kan manipuleres. Der er altsa meget, der tyder 
pS, at en dikotomisk beskrivelse af vokal- og konsonantperception ikke er 
adaekvat i forbindelse med fors0g med KP. 

Formalet med de naervaerende fors0g med KP har f0rst og fremmest vaeret at 
efterpr0ve hypotesen om en signifikant forskel mellem perceptionen af vokal- 
og konsonantlyde. For at fremkalde st0rst mulig forskel i perceptionen af 
vokal- og konsonantlyde har jeg valgt at praesentere stimuli under forhold, 
der postuleres at fremkalde den st0rste effekt, nemlig klusiler i CV-stavelser 
og isolerede langvokaler. 



Resultaier fra fors0g med kategorisk perception: et I-E-yC-A-kontinuum 



Det var min forventning, at jeg ville vaere i stand til at registrere en forskel 
mellem perceptionen af vokal- og konsonantlyde, dog ikke sa stor en forskel 
som resultateme afsl0rer. 

For det f0rste forventede jeg, at praesentationen af et VOT-kontinuum ville 
fremkalde et markant skifte i identifikationsfunktionen, en god diskrimination 
af stimuli fra forskellige kategorier, men en markant ringe diskrimination af 
stimuli fra samme kategori. 

Det forhold, at identifikationen af 10 ud af 14 stimuli hos begge fp-grupper 
viste sig at vaere signifikant med P < 0,001, demonstrerer pa bedste vis skiftet 
i identifikationsfunktionen. De 10 stimuli var dog ikke alene meget 
signifikante, men ogsa de svaereste at diskriminere. Saledes udgjorde de 
signifikante stimuli gruppen af lyde, der havde de absolut laveste 
diskriminationsprocenter med 28% som det maksimale hos danske fors0gs- 
personer og 31% som det maksimale hos finske fors0gspersoner. Omvendt 
havde b^de de danske og de finske fors0gspersoner noget lettere ved at skelne 
mellem stimuli fra forskellige kategorier, hvilket afspejler sig i 
diskriminationsprocenter belt oppe pa 88% og 69%. Resultateme fra fors0get 
med et VOT-kontinuum opfylder altsa mine forventninger til overflod: 
hverken de danske eller de finske fors0gspersoner kan skelne mellem 
forskellige stimuli, de identificerer ens. 

For det andet forventede jeg, at ogsi praesentationen af et formantkontinuum 
ville fremkalde et markant skifte i identifikationsfunktionen, men en ringe 
diskrimination af stimuli - uafhaengigt af om de tilh0rer samme eller 
forskellige kategorier. 

Ogsa ved praesentationen af isolerede vokallyde viste identifikationen sig at 
vaere meget signifikant. Hos den finske fp-gruppe var identifikationen af 13 
ud af 19 stimuli signifikant med P < 0,001, hvorimod de danske 
identifikationer var signifikante pa dette niveau i 8 tilfaelde. Diskriminationen 
af stimuli, hvad enten de tilh0rte samme eller forskellige kategorier, var 
derimod temmelig ringe. Hos de danske fors0gspersoner udgjorde den 
maksimale diskriminationsprocent af signifikante stimuli fra samme kategori 
faktisk kun 33% , hvorimod den maksimale diskriminationsprocent af stimuli 
fra samme finske kategori var oppe pa 56% - altsa lidt over 

tilfaeldighedsgraensen pa 50%. Det er dog interessant at notere, at de to eneste 
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diskriminationstoppe, der overstiger 50% percentilen, findes i samme position 
hos bSde danske og finske fors0gspersoner, nemlig mellem stimulus 8 og 9, 
10 og 11. Det er desvaerre ikke muligt at sige - pa baggrund af dette 
materiale - om diskriminationstoppenes position er betinget af ikke-sproglige 
faktorer, f.eks. intervenerende akustiske variabler, un0jagtigheder i det 
akustiske kontinuum, fysiologiske faktorer, eller om de udelukkende er 
opstaet ved en tilfaeldighed. 

Jeg kan pa baggrund af et solidt empirisk grundlag konkludere, at 
naervaerende fors0g med kategorisk perception afsl0rer en markant forskel i 
perceptionen af vokal- og konsonantkontinua, en forskel der primaert angives 
ved tilstedevaerelsen af en kategorisk effekt. Som tidligere beskrevet 
underst0tter dette resultat motorhypotesen, dvs., at fonetiske kategorier, der 
adskiller sig ved diskrete arlikulatoriske egenskaber, perciperes som 
absolutte, diskrete st0rrelser, hvorimod perceptionen er kontinuerlig, n§r 
kontinuerlig artikulatorisk variation er mulig. 



Imroduktion til dikotisk lytning 



3.1 Introduktion til dikotisk lytning 

Fors0get med kategorisk perception indikerer, at vokal- og konsonantlyde 
perciperes pa forskellig made. Arsagen til asymmetri i KP af forskellige 
sproglyde kan naturligvis ikke blotlaegges, medmindre man er i stand til at 
give en beskrivelse af de processer, der er involveret i sprogperception. 

Et af de vaesentligste spprgsmal er - efter min opfattelse - hvorfor visse 
stimuli i hpjere grad end andre kan fremkalde en kategorisk effekt, mens 
andre slet ikke fremkalder en kategorisk effekt, men snarere tyder pi 
kontinuerlig perception. Resultateme af en lang raekke underspgelser viser, at 
lukkelyde fremkalder den kraftigste kategoriske effekt, nasaler, lateraler og 
frikativer en mindre kategorisk effekt, og at vokaler perciperes kontinuert 
(jf. side 34f0. 

De fleste af synteseteorieme tager udgangspunkt i en hypotese om, at 
sprogperceptionen er kendetegnet ved fonetisk syntese, og at den er 
neurologisk naert forbundet med sprogartikulation. Saledes bunder forskellene 
mellem vokal- og konsonantperceptionen i grundlaeggende forskellige 
processer: lukkelyde bestir af mere komplekse artikulatoriske kommandoer 
end vokallyde, der er mere artikulatorisk kontinuerlige, og lukkelydene 
kraever derfor en speciel sprogprocessor, der skal varetage de komplekse 
analyser. 

Hvis perceptionen af lukkelyde kraever en sasrlig sprogprocessor, som 
analyserer de komplekse artikulatoriske kommandoer, forklarer det ligeledes 
resultater fra et belt andet forspgsparadigme, nemlig 'dikotisk lytning'. 

I fors0g med dikotisk lytning (herefter DL), dvs. dobbeltsidig h0re- 
pivirkning, praesenteres fors0gspersoneme simultant for to stimuli - en i 
hvert 0re - hvorefter de skal identificere en af de pigaeldende lyde. DL blev 
opdaget af den engelske psykolog D.E. Broadbent, der som den f0rste 
konstaterede, at nir to simultane lyde bliver praesenteret for de to 0rer, 
frembringer det ene 0re en hurtigere respons end det andet (Broadbent 1954). 
Denne effekt er ogsi bedre kendt som h0jre"0repraeferenceV H0’-praeferencen 

‘ Af bekvemmelighedsmaessige grunde vil jeg i det fplgende forkorte h0jre-0repraeference til 
H0-praeference. Venstre-0repraeference vil af samme grunde blive forkortet til V0- 
praeference. Forkoitelseme korresponderer med de engelske REA (Right Ear Advantage) og 
LEA (Left Ear Advantage). H0-praeference defineres oftest som: Antal stimulusgenkendelser i 

o 
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for sproglige stimuli er siden midten af 1950’eme blevet fortolket som udtryk 
for venstre hjemehalvdels dominans for sprog. 

Ogsa i forbindelse med dikotisk praesentation af sproglyde bar man registreret 
en markant forskel mellem lukkelyde og vokallyde, hvilket antyder en 
lateral isering af den saerlige sprogprocessor, der kraeves for analysen af 
lukkelyde, men ikke vokallyde: 

1) Lukkelydene fremkalder generelt en relativt stor H0-praeference (Cutting 
1974; Crystal & House 1974; Day & Vigorito 1973; Shankweiler & Studdert- 
Kennedy 1967; Studdert- Kennedy & Shankweiler 1970, etc.). 

2) Likvider, frikativer og semivokaler fremkalder generelt en lavere H0- 
praeference end lukkelydene (Crystal & House 1974; Cutting 1972, 1974; Day 
& Vigorito 1973; Darwin 1971; Haggard 1971). 

3) Isolerede langvokaler fremkalder under normale omstaendigheder ikke en 
H0-praeference, men haevdes endda at kunne fremkalde en V0-praeference 
(Crystal & House 1974; Cutting 1974; Day & Vigorito 1973; Studdert- 
Kennedy & Shankweiler 1970, etc.) 

Form^let med den f0lgende unders0gelse er netop at finde ud af, om der 
eksisterer en sammenhaeng mellem resultateme fra fors0g med KP og DL, 
dvs. mellem kategorisk og dikotisk effekt. 

Hiernens opbvgning 

A1 menneskelig adfaerd udgar fra hjemen og kommer til udtryk ved hjaelp af 
muskier og kirtler, savel som al menneskelig taenkning, sindsbevaegelser, 
hukommelse og viden. Hjemen er ansvarlig for alt det vi er, og alt det vi kan. 
Menneskets hjeme bestir af to hjemehalvdele (hemisfaerer) - en venstre og en 
h0jre. De arbejder forskelligt, modtager forskellige impulser, bearbejder dem 
forskelligt, men samarbejder ogsi og udveksler information. 

Hjemen er et komplekst og indviklet system, der bestir af et sindrigt 
opbygget vaev. Cortex (hjemebarken) indeholder milliarder af hjemeceller 
(neuroner), der indgir i et stort antal forbindelser med hinanden. I cortex 
findes endvidere underafdelinger med meget special iserede funktioner. 



h0jre 0re minus antal stimulusgenkendelser i venstre 0re (i %). 
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Cortex bukker omkring midteraksen i hjemen, saledes at hver af de to 
hemisfaerer udg0r en afrundet struktur, der har forbindelse med den anden 
halvdel via et stort bundt nervetrade, der kaldes corpus callosum (hjerne- 
bjaelken). I det indre af hemisfaererne (subcortex) Andes ligeledes nervetrade, 
der forbinder de forskellige dele af cortex med hinanden og med resten af 
kroppen. Alt dette kaldes tilsammen for cerebrum (storhjernen). Under 
cerebrum Andes cerebellum (lillehjemen), der hovedsagelig har med sam- 
ordningen af besked til muskleme at g0re (Teyler 1977; Frandsen 1994b). 

Venstre hemisfaere modtager nerveimpulser fra h0jre side af kroppen, mens 
h0jre hemisfaere modtager nerveimpulser fra venstre side af kroppen. Denne 
form for forbindelse kaldes kontralateral ("modsatsidig”). Hos alle mennesker 
projiceres stimuli, der praesenteres til venstre for synsfeltets centrum, eller 
som pavirker venstre h^nd eller 0re, saledes direkte til h0jre hemisfaere, og 
omvendt for stimuli i h0jre side (Kimura 1964, 1967; Nebes 1977; Frandsen 
1994a, etc.). Laesioner af den motoriske cortex f0rer ligeledes til lammelse af 
de modsat stillede lemmer, ligesom skader i den postcentrale region af cortex 
f0rer til f0lelsesl0shed i den modsatte side af kroppen (Luria 1975). Venstre 
hemisfaere modtager ogsa impulser fra venstre side af kroppen, ligesom h0jre 
hemisfaere ogsa modtager impulser fra h0jre side af kroppen. Denne 
forbindelse kaldes ipsilateral ("sammesidig”). Meddelelseme til de to 
hemisfaerer sker ved hjaelp af bade ipsi- og kontralaterale forbindelser, men 
meddelelseme gennem de kontralaterale forbindelser er dog klart de 
staerkeste. 

I det f0lgende gives en kort - og til tider forsimplet - fremstilling af 
forskningen i funktionslokalisering, dvs. forskning baseret p^ en hypotese om, 
at visse funktioner kan lokaliseres i den menneskelige hjerne. Det skal dog 
pointeres, at forskningen i funktionslokalisering er kontroversiel - hvad enten 
den baseres p^ det 18. arhundredes frenologiske studier, studier af unilaterale 
hjemeskader, eller modeme hjemescanninger, som f.eks. PET- og fMRI- 
scanninger. Den f0lgende fremstilling bygger f0rst og fremmest pa 
Segalowitz (1977), Kimura (1961a, 1961b, 1964, 1967), Wittrock (1977). 
For yderligere diskussion se bl.a. Bates (in press), Paradis (1985, 1995a, 
1995b, 1996), Paradis & Gopnik (1994). 

I 1861 opdagede den franske anatom og laege Paul Broca, at skader i en 
bestemt del af hjemen - der nu kaldes for Brocas omrade - resulterede i en 
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manglende evne til at frembringe sammenhaengende tale. 13 ar senere - i 
1874 - fandt den tyske psykiater Carl Wernicke endnu et sprogomrade i 
hjemen (Wernickes omrade). Beskadigelse af dette omrade resulterer i 
sammenhaengende, men komplet meningsl0s tale. Brocas omrade er saledes 
forbundet med evnen til at producere sprog, mens Wernickes tager sig af 
sprogperceptionen. Brocas omrade beskaeftiger sig f0rst og fremmest med 
syntaksen, hvorimod Wernickes omrade styrer de semantiske sider af sproget 
(Frandsen 1994a; Teyler 1977; Luria 1975). Begge sprogcentre findes i 
venstre hemisfaere hos (naesten) alle h0jrehandede og hos en meget stor del af 
de venstrehandede. 

At venstre hemisfaere ma vaere involveret i sprogfunktionen underby gges af 
flere forskellige forhold. Venstresidige hjemelaesioner f0rer saledes langt 
hyppigere til tab af sprogfunktionen end skader i h0jre hemisfaere. En gruppe 
b0m, der som spaede havde faet fjemet den ene eller den anden hjemehalvdel, 
blev unders0gt i 10-irsalderen. venstre hemisfaere manglede, var 
forstaelsen af syntaktiske forhold meget ringe. Nar der var pragmatiske track 
at basere forstSelsen pa, gik det bedre (Millar & Whitaker 1983). Hvis venstre 
hemisfaere kortvarigt saettes ud af funktion ved narkose^ - som det f.eks sker 
ved hjemeoperationer - resulterer det ligeledes i tab af sprog-funktionen. 
Dette sker ikke, hvis h0jre hemisfaere bed0ves (Wada & Rasmussen 1960). 
Nar verbalt materiale praesenteres i h0jre eller venstre synsfelt, viser de fleste 
fors0gspersoner endvidere en h0jre synsfelt-praeference, hvad angar svarenes 
n0jagtighed og reaktionstid - formodentlig pa grund af bedre forbindelser fra 
h0jre synsfelt til venstre hjemehalvdel. Ved l0sning af verbale opgaver er der 
ligeledes blevet pavist tegn ph st0rre aktivitet i den venstre hemisfaere 
(Morgan et al. 1971; Robbins & McAdam 1974; Wood et al. 1971). 

Generelt set foretager venstre hemisfaere en sekventiel/seriel behandling af 
impulseme, mens h0jre foretager en simultan/parallel. Viser man saledes en 
gruppe fors0gspersoner en lang raekke bogstaver, og maler man deres 
reaktionstid for at traeffe en afg0relse om alle bogstaver er ens, vil de 
bogstaver, der praesenteres i h0jre synsfelt (dvs. for venstre hemisfaere) blive 
bearejdet i serie, mens de, der praesenteres i venstre synsfelt (dvs. for h0jre 
hemisfaere) vil blive bearbejdet parallelt (Nebes 1977) Venstre hemisfaere 
fokuserer pa delen frem for helheden, mens h0jre beskaeftiger sig med hel- 



^ Almindeligvis anvendes stoffet sodium amytal (amobarbital), nlr visse omiider af hjemen 
skal saettes ud af funktion. 
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heden frem for delen. Venstre hemisfaere arbejder begrebsligt-funktionelt, 
mens h0jre arbejder visuelt-rumligt. Patienter med skader i h0jre hemisfaere 
har saledes meget svaert ved at finde vej - selv i vante omgivelser. De kan 
ikke beskrive velkendte veje, bruge et kort, laegge puslespil eller pa anden 
made taenke rumligt. Dette sker ikke for mennesker med skader i venstre 
hemisfaere. 

Forskellige funktioner kan altsa lokaliseres til forskellige omrader i de to 
hemisfaerer. De centrale sprogfunktioner synes at befinde sig i venstre hjerne- 
halvdel, men det er mere kompliceret end som sa. Ikke alle sprogets aspekter 
er begraenset hertil, og der synes ogsa at foregd en hel del non-verbalt arbejde 
i venstre hemisfaere. Meget tyder endvidere pS, at h0jre hemisfaeres 
involvering er n0dvendig i visse sproglige sammenhaenge. Ingen af de to 
hjemehalvdele kan dog under normale omstaendigheder agere uafhaengigt af 
den anden og af resten af kroppen. 

Dikotisk lytning 

0reme sender impulser til begge hemisfaerer. Dette sker ved hjaelp af bade 
ipsi- og kontralaterale forbindelser. Med denne viden er testteknikken 
dikotisk lytning udviklet. DL er dobbeltsidig h0repavirkning - dvs. det at 
lytte til forskellige lydmaessige signaler i hvert sit 0re (Wittrock 1977). Ved 
DL h0rer fors0gspersoneme saledes simultane stimuli i begge 0rer. Noget 
praesenteres for venstre 0re, mens noget andet praesenteres for h0jre. 

Metoden til dikotisk lytning blev, som tidligere naevnt, oprindeligt udviklet af 
den engelske psykolog D.E. Broadbent, der havde opdaget, at det ene 0re 
frembringer en hurtigere respons, n^ to simultane lyde bliver praesenteret 
for de to 0rer (Broadbent 1954). Siden begyndelsen af 1960'eme har metoden 
hyppigt vaeret benyttet til videre udforskning af asymmetrien mellem 
menneskets to hjemehalvdele (Kimura 1961a; 1961b; 1967 m.fl.). Tidligere 
havde unders0gelsen af hjemens funktioner kun baseret sig pk observationer 
af de f0lger, forskellige hjemeskader f0rte med sig. Med udviklingen af DL 
blev det nu muligt at benytte sig af normale fors0gspersoner. Nar mennesker 
med venstrehemisfaeredominans for sprog (dvs. st0rstedelen af 
menneskeheden) siledes h0rer dikotisk praesenteret materiale af verbal 
karakter, vil h0jre 0re typisk identificere flere stimuli end venstre, hvilket 
betegnes H0“praeference. Hos mennesker med sprogcenteret repraesenteret i 
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h0jre hemisfaere, g0r det omvendte sig gaeldende. Her identificerer venstre 
0re flere stimuli end h0jre (Kimura 1961b:168). 

Kimura (1967) pSpeger, at hemisfaereasymmetrien kun kan demonstreres, nSr 
der er konkurrence mellem stimuli dvs. ved dikotisk praesentation. Derimod 
kan der ikke pSvises nogen asymmetri, hvis stimuli praesenteres monauralt^ 
Dette skyldes nervebanemes opbygning. Bade de ipsilaterale og de kontra- 
laterale baner sender impulser til hemisfaereme. De kontralaterale baner er 
imidlertid de staerkeste og denned i stand til at saette de ipsilaterale (delvist) 
ud af kraft. Dette kaldes for okklusionsmekanismen (Kimura 1967:171). NSr 
forskellige stimuli praesenteres for 0reme - sidan som det sker ved DL - vil 
den staerke impuls fra det kontralaterale 0re blokere for den svage impuls fra 
det ipsilaterale. Reelt modtager hemisfaereme saledes kun impulseme fra det 
kontralaterale 0re. Nar h0jre 0re hos de fleste mennesker identificerer flere 
sproglige stimuli ved dikotisk praesentation end venstre 0re, skyldes det, at 
h0jre 0re takket vaere de kontralaterale forbindelsers overlegenhed bar bedre 
adgang til sprogcentrene i venstre hemisfaere. Mens h0jre 0re saledes bar 
direkte forbindelse til venstre bemisfaere, skal venstre 0res vej til sprog- 
omrideme f0rst gl gennem b0jre bemisfaere, f0r den “krydser over” til 
venstre side, jf. flgur 3.1.1 (fra Krasben 1977:114). 




Figur 3.1.1 



Dikotisk lytning er oftest blevet bnigt til at pSvise venstre bjemebalvdels 
dominans for sprog. SSledes er H0-praeference blevet pSvist mange gange ved 
dikotisk praesentation af sprogligt materiale. BSde meningsfyldte ord, vr0vle- 
ord og syntetisk producerede CV-stavelser afsl0rer en H0-praeference (Curry 
1968). Donald Dirks (1964) bar pSvist, at korte ord (f.eks. tal) fremviser en 



^ Ved monaural praesentation afspilles der kun stimuli i et 0re ad gangen. Der praesenteres ikke 
noget for det andet 0re. 
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H0-praeference, ligesom man har fundet eksempler pa, at den grammatiske 
opbygning af saetninger (Zurif & Sait 1969) samt baglaens afspillet tale 
analyseres bedst af venstre hemisfaere. Generelt set afsl0rer dikotisk 
praesenterede konsonanter en H0-praeference, mens det samme ikke g0r sig 
gaeldende for vokaler (Day & Vigorito 1973). 

Omvendt bar man observeret en V0-praeference ved dikotisk praesentation af 
melodier (Kimura 1964), tonekonturer, milj0st0j (Curry 1967, Spellacy 
1970), intonationskonturer (Blumstein & Cooper 1974) samt f0lelsesmaessige 
betoninger i sproget (Bryden & Ley 1983). 

Den eksperimentelle indgangsvinkel til unders0gelser af hemisfaere- 
asymmetrien har bide sine fordele og sine ulemper. Ud over de tidligere 
omtalte ulemper ved eksperimentelt arbejde (jf. side 5) indebaerer fors0g med 
DL at fors0gspersoneme lytter pa en unaturlig made. Maden man er op- 
maerksom pi ved DL er belt forskellig fra den mide, man er opmaerksom pi i 
en naturlig situation. I en almindelig kommunikationssituation er 
opmaerksomheden rettet mod forstielsen, mens man ved DL fokuserer pi det 
lydlige udtryksmiddel. Metoden muligg0r siledes unders0gelser af meget 
specifikke lydlige enkeltfaenomener i forhold til hemisfaereme. 

De f0rste iagttagelser af, hvor forskellige funktioner kunne lokali seres i 
hjemen, blev gjort ud fra observationer af de f0lger, unilaterale hjemeskader 
f0rte med sig. Forskning i hemisfaereasymmetri var siledes begraenset til at 
omfatte hjemeskadede personer. Nir en person bliver skadet i hjemen, sker 
der imidlertid ogsi en aendring af denne persons psyke. Hvor meget af en 
hjemeskadet persons adfaerd der skyldes selve hjemeskaden, og hvor meget 
der skyldes de psykologiske f0lger af den, synes derfor umuligt at afg0re. 

Andre iagttagelser af hjemens funktioner er fors0gt gjort ved hjaelp af 
sikaldte EEG-udsving. EEG (elektroencefalogram) er det billede af elektrisk 
aktivitet, der kan registreres fra hjemebarken ved brug af overflade- 
elektroder, der anbringes i hovedbunden (Wittrock 1977). Da EEG afspejler 
aktiviteten i en stor gruppe neuroner pi en gang, er milingen ikke af st0rre 
vaerdi ved unders0gelsen af mere specifikke funktioner i hjemen (Teyler 
1977). 
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En af de nyere mSder at udforske hjemens funktioner pa sker ved hjaelp af 
sakaldte biomagnetiske malinger. Et relativt nyt apparat - PET-scanneren"^ - 
g0r det sSledes muligt at male de magnetiske kraftfelter i hjemen og derved 
skabe et ganske n0jagtigt billede af, hvad der foregSr . i hjemen, nkr vi 
foretager os forskellige ting (jf. f.eks. Bottini et al. 1994). Metoden har uden 
tvivl tiden for sig, men det tekniske udstyr er stadigvaek sS kostbart, at kun de 
fserreste har rSd til at benytte sig af det. Desuden er der endnu ikke ret 
mange, der besidder den n0dvendige ekspertise til at betjene apparaturet 
(Hofstatter 1992). De bedste eksisterende metoder til unders0gelse af 
hemisfaereasymmetri synes derfor at vsere DL og dens visuelle modsvarighed 
takistoskopitesten^ 



* PET er en forkortelse for 'Positron Emission Tomography'. Ved PET-studier indspr0jtes et 
glukoselignende stof i fors0gspersoner, hvorefter den neurologiske aktivitet kan miles. Se 
desuden NeuroReport (8: 3809-3815) for en beskrivelse af unders0gelser med fMRl. 

^ Begge 0jne sender synsindtryk fra h0jre side af synsfeltet til venstre hemisfaere og fra 
venstre halvdel af synsfeltet til h0jre hemisfaere. Omkring synsfeltets midterakse forefindes en 
rffikke synsceller, der sender impulser til begge hemsifaerer. 0nsker man at lateralisere de 
visuelle stimuli, mi man derfor holde en vis afstand til midteraksen. Stimuli mi desuden kun 
fremvises i 150 millisekunder, for at kun den 0nskede hemisfaere ser noget. Den traditionelle 
mide at lateralisere visuelle stimuli pi er at anvende et takistoskop - dvs. en 
lysbilledfremviser, der kan indstilles til kun at fremvise stimuli i meget korte perioder 
(Frandsen 1994a). 
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3.2 Fors0g med dikotisk lytning 

Pilottest og procedure 

Forud for dette fors0g har jeg tidligere arbejdet med dikotisk lytning, bl.a i 
1994-95, hvor jeg i samarbejde med J0rgen N0rby Jensen udarbejdede en 
fors0gsraekke med titlen 'En unders0gelse af dikotisk lytning som metode til 
studiet af hemisfaereasymmetri og sprogperception'. I forbindelse med det 
projekt blev der udf0rt en lang raekke pilotfors0g. Indledningsvis lavede vi 
test med bade almindelige ord og nonsens-ord. Disse test gav dog ingen 
konsistente resultater*. Herefter udarbejdede vi en pilottest, hvor stimuli ([be], 
[de], [ge], [pe], [te] og [ke]) en efter en blev praesenteret f0rst for det venstre 
0re og sS for det h0jre, mens der blev sendt st0j (en tone genereret ved en 
300 Hz sinuskurve) i det andet. Vi forventede at kunne lateralisere stimuli pa 
denne mSde og derved pavise en H0-praeference. Resultateme af denne test 
viste imidlertid hverken en h0jre- eller venstre-0repraeference: hvis der i det 
f0rste fors0g var venstre-0repraeference, var der i det andet h0jre- 
0repraeference; 0repraeferencen skiftede sk at sige fra fors0g til fors0g. 
Testen viste, at st0j og sproglyde ikke kan fungere som ligevaerdige 
konkurrerende stimuli^ Stimuli lateraliseres ikke, og dermed kan der ikke 
afsl0res nogen 0repraeference. 

Vi udarbejdede herefter en pilottest, hvor de samme stimuli blev praesenteret 
dikotisk og lateralt (f.eks. blev [be] praesenteret for h0jre 0re, mens [de] 
sendtes ind i det venstre). Vi bad fors0gspersoneme vurdere, om en given 
stimulus blev praesenteret eller ej. Svarene blev herefter kategoriseret efter 
korrekthed. Resultateme af denne test afsl0rede en generel H0-praeference - 
dvs. der var flere korrekte svar ved stimuli praesenteret for h0jre 0re end ved 
stimuli praesenteret for venstre 0re. PS baggmnd af de erfaringer, som ud- 
sprang af de indledende pilottest, udarbejdede vi det endelige fors0g med 
dikotisk lytning. 

Da den beskrevne metode er gennempr0vet med succes, har jeg valgt ogsa at 
anvende den i dette fors0g med DL. Den eneste afvigelse vil vaere de stimuli, 
der indgar i fors0get, samt de to fp-grupper, der ligeledes indgik i fors0get 
med KP. 



' Testene med almindelige ord og nonsens-ord blev udfprt pa et meget tidligt tidspunkt i 
arbejdsprocessen, hvor vi endnu ikke var belt inde i metodikken omkring dikotisk lytning. 
Dette kan vaere en af grundene til resultatemes manglende konsistens. 

^ Dette forhold beskrives naermere s. 1 1 If. 
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Praesentationskriterier 

Pa baggrund af mine egne og andres fors0g inden for forskningsparadigmet 
'dikotisk lytning’, vil jeg i det f0lgende opstille en raekke kriterier, der skal 
opfyldes i et fors0g med dikotisk praesentation. 

1) Konkurrence mellem de praesenterede stimuli er en nOdvendig betingelse 
for at kunne fremprovokere en H0-praeference . Dette skyldes, som tidligere 
omtalt (s. 112f), at ved praesentation af €n stimulus i €t 0re varetager de 
kontralaterale nerveforbindelser kommunikationen med den modsatte 
hjemehalvdel, hvorimod de ipsilaterale nerveforbindelser kommunikerer 
repraesentationen^ til den sammesidige hjemehalvdel. For at kunne fremtvinge 
en dikotisk effekt skal to lydlige stimuli altsS praesenteres konkurrerende, sS 
kun de "staerke" kontralaterale nerveforbindelser sender information og de 
"svage" ipsilaterale forbindelser saettes ud af funktion. Dette faenomen, at de 
ipsilaterale nerveforbindelser saettes ud af kraft, betegnes som naevnt hos 
Kimura "The Occlusion Mechanism" - okklusions-mekanismen (1967:170). 
Med andre ord: Hvis de ipsilaterale nerve-forbindelser ikke saettes ud af kraft 
(okklusionsmekanismen), sa vil praesentationen af stimuli heller ikke resultere 
i en H0-praeference. Det forklarer, hvorfor et dikotisk reaktionsm0nster ikke 
kan fremprovokeres i en monaural test. 

Okklusionsmekanismen traeder i funktion, nar to forskellige stimuli 
praesenteres samtidig (i hvert sit 0re). -Men hvad vil det sige, at stimuli 
praesenteres samtidig? Kimura har studeret dette sp0rgsmal indgaende i en 
raekke fors0g. Hun konkluderer f0lgende; 

“When digits are alternated rapidly between ears, but do not actually overlap, there is only a 
non-significant trend for the right ear to be better*' (Kimura 1967:169). 

2) If0lge Kimura o.a., der beskriver metodikken i fors0g med dikotisk 
lytning, er konkurrence mellem de praesenterede stimuli en nodvendig og 
tilstraekkelig betingelse for at fremkalde en dikotisk effekt (jf. Kimura 1967). 
At betingelsen er tilstraekkelig, mener jeg ikke er korrekt. I en pilottest (jf. 
side 1 16), hvor de sproglige stimuli [b], [d], [g], [p], [t] og [k] blev praesenteret 



^ Ved 'repraesentation' skal der forstSs den pagaeldende 1yds samlede information i hjemen. 
Denne repraesentation har naturligvis ikke samme form som den akustiske 1yd. Praecis hvilken 
form (og struktur) denne repraesentation har, er et kompliceret spdrgsmM, der falder uden for 
dette fors0gs rammer. 
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kombineret med en ikke-sproglig distraktionslyd'^ (en 300 Hz sinustone), 
kunne J0rgen N0rby Jensen og jeg konstatere, at der ingen signifikant 
0repraeference var at spore (Jensen & Madsen 1995). Der er i 0vrigt ikke - s§ 
vidt jeg ved - udf0rt vellykkede fors0g med dikotisk effekt, hvor fokuslyden 
bar vaeret af en sproglig art og distraktionslyden af en ikke-sproglig. I 
tidligere fors0g (Kimura 1964; Curry 1967; Spellacy 1970), hvor ikke- 
sproglige lyde er blevet praesenteret konkurrerende i kombination med andre 
ikke-sproglige lyde, er der derimod ofte blevet pavist en signifikant 0re- 
praeference (ved disse fors0g en V0-praeference)^. Med andre ord er der 
meget der tyder pa, at de konkurrerende lyde skal have samme perceptuelle 
status, dvs., at repraesentationeme skal have en vis stnikturel lighed for at den 
konkurrerende praesentation vil have en dikotisk effekt. Jeg vil altsa 
konkludere, at konkurrence mellem praesenterede stimuli med samme 
perceptuelle status er en n0dvendig og tilstraekkelig betingelse for at 
fremkalde en dikotisk effekt. 

3) I beskrivelsen af fors0g med dikotisk lytning er det uheldigvis hidtil blevet 
overset, hvor vigtigt det er, at stimuli har samme perceptuelle status. Det er 
isaer uheldigt, fordi denne betingelse giver os nyttige oplysninger om de 
mentale operationer. I det f0lgende afsnit vil jeg beskaeftige mig med netop 
dette forhold^. 

Det primaere sp0rgsmal ma vaere: Hvad er forskellen mellem fors0g, hvor 
stimuli har samme perceptuelle status, og fors0g, hvor stimuli har forskellig 
perceptuel status? Hvad angar nerveforbindelsernes informationsoverf0rsel, 
er der ingen forskel pa de to fors0gsopstillinger. I begge tilfaelde praesenteres 
to forskellige stimuli simultant, hvilket aktiverer okklusionsmekanismen. Det 
er min opfattelse, at n0dvendigheden af strukturel lighed ikke skyldes nerve- 
banemes arkitektur, da den ikke forandres af stimulienes karakter. Hvis 
forskellen var den, at sproglige stimuli blev "opfattet" bedst af venstre 
hemisfaere, og ikke-sproglige stimuli af h0jre hemisfaere, sa skulle en test, 
hvor stimuli havde forskellig status netop give en markant H0-praeference pa 
de sproglige stimuli, og en markant V0-praeference pa de ikke-sproglige. Det 



^ Af fremstillingsmaessige arsager har jeg valgt at bruge betegnelseme ‘fokuslyd* og 
'distraktionslyd', som referencer til henholdsvis de stimuli, fors0gspersoneme skal lytte efter, 
og de stimuli, der skal virke som distraktion (og effektuere okklusionsmekanismen). 

^ De ikke-sproglige lyde udg0r f.eks. melodier, lyde fra omgivelseme som f.eks. hundeg0en, 
smaekkende d0re, toiletskyllen etc. 

® Jeg vil geme pointere, at beskrivelsen er af deduktiv art og uden empirisk belaeg. 
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er da ogsa sund fomuft med vores viden om hemisfaeremes funktions- 
specialisering, at en 0repraeference kun vil opsta, hvis identifikationen af 
begge stimuli fonidsastter en og samme funktion - en funktion, der kun er til 
stede i den ene hemisfaere. Med andre ord forudsaetter den dikotiske effekt en 
hemisfaereasvmmetri. 



Det er tidligere blevet beskrevet (og illustreret i fig. 3.1.1), at en sproglig 
stimulus, der praesenteres for venstre 0re, f0rst repraesenteres i h0jre 
hemisfaere, f0r den repraesenteres i venstre. Den skal billedlig talt ”ad en 
omvej”. Derfor vil en sproglig stimulus, der praesenteres for h0jre 0re, blive 
repraesenteret i venstre hemisfaere tidligere end den stimulus, der praesenteres 
for venstre 0re. Og netop den tidslige faktor er afg0rende for en dikotisk 
effekt. Nar den sproglige stimulus, der er praesenteret for venstre 0re, 
"ankommer" til venstre hemisfaere, sa er sprogprocessoren optaget, og 
stimulusen mk derfor sta i venteposition. Denne venteposition er bedre kendt 
under betegnelsen ’sensorisk hukommelse'. Den sensoriske hukommelse 
spiller en vaesentlig rolle i vores sansning af omverdenen, idet den 
sammenkaeder forskellige sanseoplevelser til en gestalt. Uden den sensoriske 
hukommelse ville vores sanseoplevelser vaere et stort kaos. Men den 
sensoriske hukommelses dannelse af gestalter betyder ogsi et tab af 
information: Studiet af subliminal perception har vist, at den sensoriske 
hukommelse ikke kan rumme mere end 25 billeder pr. sekund. Tilsvarende er 
der ogsk graenser for, hvor meget lydlig information den sensoriske 
hukommelse kan fastholde. Det er min opfattelse, at den dikotiske effekt 
faktisk er et udtryk for tab af information i den sensoriske hukommelse’. 
Tabet af information er st0rst for de sproglige stimuli, der praesenteres for 
venstre 0re, fordi det er de stimuli, der skal fastholdes i den sensoriske 
hukommelse. I et fors0g, hvor distraktionslyden er ikke-sproglig, vil den 
sproglige fokuslyd ikke blive blokeret. Derfor fremkaldes der ingen dikotisk 
effekt, nkr de konkurrerende stimuli har forskellig perceptuel status. 
Ydermere viser Kimuras unders0gelser af overlap i praesentationen af stimuli, 
at jo kortere tid, der er mellem praesentationen af den lydlige information, 
desto st0rre tab af information og dermed st0rre 0repraeference (Kimura 
1967). Eller kort sagt: Jo laengere tid mellem praesentationen af to stimuli, 
desto mindre 0repraeference. leg vil altsi konkludere, at konkurrence mellem 



^ Denne antagelse stemmer da ogsS ganske godt overens med en lang raekke fors0g, der har 
haft det formll at unders0ge hukommelsens indvirkning pS sprogperception, jf. f.eks. 
Broadbent 1954; Massaro 1970, 1971, 1972, 1975; Massaro & Oden 1980; Pisoni 1972. 
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simultant praesenterede stimuli med samme perceptuelle status er n0dvendige 
og tilstraekkelige betingelser for at fremkalde en 0repraeference. 
0repraeferencen vil manifesteres som f0lge af hemisfaereasymmetri og tab af 
information i den sensoriske hukommelse. 

Hypoteser 

Som tidligere beskrevet (jf. side 112ff) afspejler fors0g med DL en 
lateralisering af de processer, der varetager analysen af visse sproglyde. 
Meget tyder altsa pa, at der eksisterer en sammenhaeng mellem de 
lateral iserede processer, der kan fremkalde en dikotisk effekt, og de 
processer, der i fors0g med KP fremkalder en kategorisk effekt. Det forhold, 
at den kategoriske og dikotiske effekt er maksimal ved praesentation af 
klusiler, mindre ved praesentation af likvider, frikativer og semivokaler og 
belt fravaerende ved praesentation af vokaler, kan tolkes pi (mindst) to mider: 

A. Den generelle funktionsfordeling i hjemen vedr0rer ogsa analysen af 
sproglig stimulation, slledes at venstre hemisfaere foretager en 
sekventiel/seriel behandling af stimuli med fokus pa delen frem for helheden, 
mens h0jre hemisfaere arbejder simultant/parallelt med lyd-gestalter og 
fokuserer pi helheden frem for delen. 

B. De specifikt sproglige funktioner befinder sig i venstre hemisfaere, hvor 
en saerlig sprogprocessor reducerer en psykoakustisk replika af stimulationen 
til komplekse artikulatoriske kommandoer. Parallelt med den motoriske 
analyse af artikulatorisk komplekse sproglyde foretages generelle auditive 
analyser, der ikke er lokaliseret i kun den ene hemisfaere. 

Fortolkning A svarer ganske godt til flere af de postulerede psykoakustiske 
perceptionsmodeller, der antager at sprogperceptionen kan forklares ved 
generelle auditive principper (jf. Macmillan et al. 1977; Miller et al. 1976; 
Pastore 1981; Schouten 1980, 1987 etc.). Hvis denne fortolkning er korrekt, 
skal man i fors0g med DL forvente at finde en H0-praeference for lukkelyde 
og en V0-praeference for vokaler. Unders0gelser af hjemeskadede personer 
giver dog ingen indikationer om saerlige problemer med identifikation af 
vokallyde i forbindelse med skader i h0jre hemisfaere eller saerlige problemer 
med identifikation af konsonantlyde (klusiler) i forbindelse med skader i 
venstre hemisfaere. Tilsvarende viser unders0gelser af SLl-patienter* heller 

® SLl er en hyppig anvendt forkortelse for 'Specific Language Impairment', der er et kraftigt 

o 
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ikke nogen forbindelse mellem perceptionen af hhv. vokal- og konsonantlyde 
og hemisfaereasymmetrien, som den postuleres i A. Der er altsa ingen 
unders0gelser, som jeg kender til, der taler for tolkning A. 

Fortolkning B er i grove track identisk med Fujisaki & Kawashimas ’dual- 
process model’, der kombinerer motorteoriens antagelse om, at sprog- 
perceptionen involverer et saet neurologiske motorkommandoer, med 
generelle auditive principper for perception af akustisk stimulation (Fujisaki 
& Kawashima 1969, 1970, 1971; Pisoni 1971, 1972, 1973, 1975; Pisoni & 
Lazarus 1974; Pisoni & Tash 1974). Hvis tolkning B - og dermed ’dual- 
process modellen’ - er korrekt, skal man i det f0lgende fors0g med DL 
forvente disse resultater: 

1) De processer, der varetager analysen af klusiler, er lateraliserede, hvilket 
afspejles i en H0-praeference i fors0g med DL. 

2) Analysen af likvider, frikativer og semivokaler er kun delvis afhaengig af 
de lateraliserede processer, hvilket afspejles i en mindre H0-praeference end 
ved dikotisk praesentation af lukkelyde. 

3) De processer, der varetager analysen af vokallyde, er generelle auditive 
processer og afspejler derfor ikke 0repraeference i fors0g med DL, 

Stimuli 

Jeg anser beskrivelsen af stimuli som en vigtig forudsaetning for en rimelig 
vurdering af fors0gsresultateme. jeg 0nsker at understrege dette, sa er 
det fordi jeg mener, at det er meget uheldigt enten belt at udelade eller give 
en ufuldstaendig beskrivelse af stimuli (hvilket ofte er tilfaeldet, jf. Broadbent 
1954; Kimura 1961a, 1961b, 1964; Springer 1971; Curry 1968; Berlin 1973 
etc.)^ 

I fors0g med DL er en beskrivelse af stimuli simpelthen en forudsaetning for 
en rimelig tolkning af resultateme - isaer i et fors0g som dette, hvor jeg har 
valgt at fokusere p^ relationen mellem stimuli og hemisfaereasymmetri. Det er 
n0dvendigt at have et detaljeret kendskab til de praesenterede stimuli for at 

voksende forskningsomrade (Paradis 1985, 1990; Paradis & Gopnik 1994). 

^ Det store antal pilottest, jeg har udf0rt, skyldes bl.a., at det var umuligt at reproducere mange 
af de fors0g, der er beskrevet i forskellige sammenheenge - beskrivelseme af stimuli var 
simpelthen sa mangelfulde, at der umuligt kunne blive tale om reproduktion. 
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kunne bed0mme, om effekten af praesentationen kan henledes til en 
hemisfaereasymmetri eller om den blot skyldes forskellen mellem de 
praesenterede stimuli. 

I to af de tre delfors0g med dikotisk praesentation bar jeg valgt at anvende de 
samme stimuli, som blev anvendt i fors0get med kategorisk perception. I det 
f0rste delfors0g praesenteres fors0gspersoneme for et VOT-kontinuum 
bestiende af 14 stimuli (jf. beskrivelsen side 53 ff) - samme kontinuum som i 
fors0get med KP blev tilskrevet kategorieme ’S, T og ’D. I det andet del- 
fors0g praesenteres fors0gspersoneme for et Fl-F2-kontinuum bestaende af 
19 stimuli (jf. beskrivelsen side 59ff) - altsa det kontinuum, der i fors0get 
med KP blev tilskrevet de fire danske kategorier ’I, ’E, ’/E og ’A eller de tre 
finske kategorier ’I, ’E og ’A. 

I det sidste af de tre delfors0g bar jeg valgt at praesentere 5 CV-stavelser, 
nemlig en lateral, to nasalkonsonanter (berefter ’nasaler’) og to frikativer 
kombineret med et [a]: [la], [ma], [na], [fa] og [va]. Formalet med at 
praesentere disse stimuli er naturligvis at finde ud af, om lateraler, nasaler og 
frikativer resulterer i en dikotisk effekt, dvs. en H0- eller V0-praeference. 

Som f0rste trin i udarbejdelsen af de 5 stimuli indtalte jeg stavelseme [la], 
[ma], [na], [fa] og [va] pa en baerbar pc ved bjaelp af dens indbyggede 
mikrofon'®. De 5 stimuli blev indtalt direkte pa en 16-bit lydfil (44.100 Hz). 
Jeg valgte at indtale CV-stavelseme si monotont som muligt med meget korte 
mellemrum pa en lydfil for at undga alt for stor variation. Demaest gik jeg i 
gang med at tilpasse den alt for lange lydfil til 5 separate lydfiler med de 
digitaliserede signaler. I alle andre benseender blev de 5 CV-stavelser [la], 
[ma], [na], [fa] og [va] bearbejdet pa samme made som de andre stimuli (jf. 
side 52ff). 



Alle de stimuli, jeg bar beskrevet ovenfor, udg0r fokuslyden i den dikotiske 
praesentation. -Men for at kunne fremkalde en dikotisk effekt, skal man 
simultant praesentere to stimuli, en fokuslyd og en distraktionslyd. Som 
distraktionslyd bar jeg valgt en stimulus, der skal udg0re distraktionslyd i alle 



Oprindelig var det kun min intention at anvende indtalingen i en pilottest, men da 
lydkvaliteten viste sig at vaere rimelig h0j og fors0gsresultateme konsistente, sa jeg ingen 
grund til at aendre pci stimuli. Desuden skal det tilf0jes, at det akustiske signal, vi modtager i en 
almindelig dagligdags samtale, ofte er af langt ringere kvalitet, men sjaeldent giver perceptuelle 
problemer. 
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fors0gene, nemlig [ka:]. Fordelen ved denne distraktionslyd er, at den kan 
opfattes pa flere mader - som et dansk ord (sg. af substantivet ’karre’) og som 
et engelsk ord (sg. af substantivet ’car’) - hvilket er en n0dvendighed, nar 
man arbejder med flere sproggrupper (her danske og finske 
fors0gspersoner). I fors0get med DL bestSr alle stimuli af en fokuslyd og en 
distraktionslyd, der er indspillet pa en to-spors lydfil, saledes at fokuslyden er 
pS det ene spor og distraktions-lyden pa det andet spor. 

Procedure 

Proceduren i afviklingen af fors0get med DL svarer stort set til fors0get med 
KP. For det f0rste blev fors0get med DL afviklet ved hjaelp af praesentations- 
og registreringsprogrammet DikoTest 3.0, der var installeret pi en baerbar 
pc. De anvendte praesentationsserier var alle bygget op efter det samme 
princip: f0rst defineres en to-sporet *.wav-lydfil, som DikoTest kan afspille i 
medieafspilleren. Demaest praesenteres den tilh0rende tekst pi skaermen: 

Identifikationsovelser med dikotisk praesentation **: 

Konsonanter: ’H0rer du et D, S eller T? Svar med tast. #xx’ 

[la-ma-na-fa-va]: ’HOrer du et F, L, M, N eller V? Svar med tast. #xx’ 

V okaler : ’HOrer du et A, E, I eller ^E? Svar med £n tast. #xx’ 

Identifikationsserieme for det akustiske S-T-D-kontinuum er identiske med de 
anvendte serier i fors0get med KP, dvs., at hver identifikationsserie bestir af 
28 praesentationer. 

Identifikationsserieme for det syntetiske vokalkontinuum er ligeledes 
identiske med de identifikationsserier, der blev anvendt i fors0get med KP, 
dvs., at hver identifikationsserie bestir af 19 praesentationer. 

For de nye stimuli [la], [ma], [na], [fa] og [va] blev der fremstillet en 
identifikationsserie bestiende af 20 praesentationer, dvs., at hver af de 5 
stimuli blev praesenteret 2 gange for H0 og 2 gange for V0. 

Ogsi i forbindelse med dikotisk praesentation blev hver praesentationsserie 
indledt af en "introduktionsrunde" bestiende af 6 identifikations0velser, der 



■#xx’ repraesenterer et praesentationsnummer, som fors0gspersoneme skulle notere, hvis 
deres respons via tastaturet var forkert, dvs. utilsigtet. Igen blev responsmulighedeme opstillet 
i alfabetisk raekkef0lge. 
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ikke er medregnet som fors0gsresultater. De 4 basisserier for S-T-D- 
identifikation, L-M-N-F-V-identifikation og I-E-/E-A-identifikation betegnes 
herefter ’C-Iden-Basis.XLS’, ’X-Iden-Basis.XLS’ og ’V-Iden-Basis.XLS’. 

Fors0gsforhold og forsogspersoner 

Fors0get med DL fandt i alle tilfaelde sted i forlaengelse af fors0get med KP, 
og jeg fandt det ikke n0dvendigt at oplyse fors0gspersoneme om, at der 
faktisk var tale om to saerskilte fors0g. 

I fors0get med DL deltog de samme fors0gspersoner som i fors0get med KP, 
dvs., i alt 57 personer fordelt pa 41 danskere og 16 finner, 42 kvinder og 15 
msend i alderen 12-61 ar. Ingen af fors0gspersoneme medvirkede flere 
gange. 

Det var ikke alle fors0gspersoner, der responderede pa samtlige 3 testserier - 
enkelte deltagere valgte at springe fra efter kun at have gennemgaet en af de 
to hovedkategorier, konsonantidentifikation, vokalidentifikation eller 
identifikation af [la-ma-na-fa-va]^^. Desuden valgte jeg at praesentere [la], 
[ma], [na], [fa] og [va] for de danske fors0gspersoner, men ikke for de finske, 
hvilket skyldes, at disse stimuli ikke alle korresponderer med finske 
sproglyde. 

I registreringsskemaet har hver enkel fors0gsperson oplyst, om 
vedkommende er h0jrehandet eller venstrehandet. Pa baggrund af disse 
oplysninger var det min hensigt at inddele den samlede fp-population i to sub- 
kategorier, nemlig i 6n bestaende af h0jrehandede og en anden af venstre- 
handede fors0gspersoner. Som tidligere omtalt (side 110) er det dog kun 
meget fS af de venstrehandede, der rent faktisk har det centrale sprogcenter 
placeret i h0jre hemisfaere. Da ingen af fors0gspersonerne udviste en adfaerd, 
der kunne tolkes som en lateralisering omvendt af majoritetens, besluttede jeg 
at behandle fors0gsresultater fra de to subkategorier under et. 



Jeg fors0gte lige som tidligere at fordele det samlede antal fors0gs personer over de 5 
varianter af hver praesentationsserie, jf. figur 3.2.1 . 
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3.3 Resultater fra fors0g med dikotisk lytning: 
et S-T-D-kontinuum 

Det er min hensigt i det f0lgende at praesentere resultater fra fors0g med 
dikotisk praesentation af et VOT-kontinuum, et formantkontinuum og af [la], 
[ma], [na], [fa], [va]. Desuden vil jeg analysere de praesenterede resultater med 
henblik pi de opstillede hypoteser om hemisfaereasymmetri i kapitel 3.2. 

Resultateme stammer fra de to tidligere omtalte fp-grupper bestaende af 41 
danskere og 16 finner. Der vil ikke blive skelnet mellem h0jrehandede og 
venstrehindede, da alle fors0gspersoneme 0jensynlig stemmer med normen, 
dvs., at de bar den centrale sprogprocessor i venstre hemisfaere. 

De f0rste resultater, jeg vil praesentere, er de danske og de finske fors0gs- 
personers identifikation af 14 stimuli som enten ’dale’, ’sale’ eller ’tale'. Alle 
14 stimuli blev praesenteret kombineret med en konkurrerende distraktions- 
1yd. 
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Figur 3.3.1 



Gruppen af danske fors0gspersoner bestod af 39 personer, hvilket betyder, at 
procentfordelingen i figur 3.3.1 er baseret pi 546 praesentationer og 
identifikationer (39 • 14). 

Som det tydeligt fremgar af modellen, bar fors0gspersoneme kunnet 
identificere alle stimuli som tilh0rende en af de tre kategorier, bide ved 
binaural og dikotisk praesentation. Endvidere fremgir det, at identifikationer 
ved dikotisk praesentation med fokuslyden i H0 og distraktionslyden i V0 i 
h0j grad stemmer overens med identifikationer ved binaural praesentation. 
Derimod afviger identifikationer ved dikotisk praesentation med fokuslyden i 
V0 pi visse punkter fra identifikationer ved binaural praesentation. Kort sagt 
afspejler modellen en generel H0-praeference. 

I histogrammet over de finske fors0gspersoners identifikation af samme 
VOT-kontinuum, praesenteret dikotisk og binauralt, finder vi samme 
generelle H0-praeference, jf. figur 3.3.2. 
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Figur 3.3.2 

Gnippen af finske fors0gspersoner bestod af 16 personer, hvilket betyder, at 
procentfordelingen i figur 3.3.2 bygger pi 224 praesentationer og 
identifikationer (16 • 14). 

Ogsi i figur 3.3.2 ser vi, identifikationer ved binaural praesentation i hOjere 
grad stemmer overens med identifikationer ved dikotisk praesentation med 
fokuslyden i H0 end ved dikotisk praesentation med fokuslyden i V0. De 
finske resultater afspejler altsi ogsa en generel H0-praeference. 

Ser vi naermere pi, hvordan de to grupper bar tilskrevet kategorier til det 
akustiske kontinuum - praesenteret hhv. dikotisk og binauralt - traeder nogle 
forskelle frem. Hvis vi fortolker forskellen mellem dikotisk praesenterede 
stimuli og binauralt praesenterede stimuli som udtryk for hemisfaere- 
asymmetri, er det muligt at fremhaeve H0-praeferencen. I figur 3.3.3 
fokuserer jeg udelukkende pi den akkumulerede forskel (i procent) mellem 
identifikationer ved binaural praesentation og ved dikotisk praesentation med 
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fokuslyden i H0, og den akkumulerede forskel mellem identifikationer ved 
binaural praesentation og ved dikotisk presentation med fokuslyden i V0. 
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Figur 3.3.3 

Ved at fremheve den akkumulerede forskel mellem identifikationer ved 
"normal” presentation, dvs. binaural presentation, og dikotisk presentation, 
kan vi illustrere to vesentlige forhold: 

1) For det f0rste er H0-preferencen meget tydelig. I forhold til 
identifikationer ved binaural presentation afviger dikotisk presentation af 
fokuslyde i H0 mindre - eller lige sa lidt, men aldrig mere - end dikotisk 
presentation af fokuslyde i V0. 

2) For det andet er H0-preferencen tydeligvis st0rre ved de sprogspecifikke 
kategorigrenser. De tidligere beskrevne identifikations0velser blotlagde 
forskelle mellem de danske og de finske kategorier og kategorigrenser: 
fors0g med danske fors0gspersoner afsl0rede en kategorigrense mellem [s] 
og [t] ved stimulus 4 og 5, samt en kategorigrense mellem [t] og [d] ved 
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stimulus 10 og 11. I fors0get med DL finder vi netop den h0jeste H0- 
praeference ved disse kategorigraenser. Identifikations0velsen med de finske 
fors0gspersoner afsl0rede ligeledes en kategorigraense mellem [s] og [t], men 
hos de finske fors0gspersoner mellem stimulus 6 og 7, og en kategorigraense 
mellem [t] og [d] ved stimulus 11. Ogsa hos de finske fors0gspersoner finder 
vi altsa en korrelation mellem H0-praeference og kategorigraenser. 

Arsagen til at H0-praeferencen korrelerer med kategoritilskrivningen er 
sandsynligvis, at stimuli, der under alle omstaendigheder er svaere at 
identiflcere, lettere kan maskeres af en distraktionslyd, end stimuli, der 
generelt er lette at identiflcere. Med andre ord kan en h0j identifikations- 
procent udligne 0redifferencen. Denne fortolkning er i 0vrigt helt i overens- 
stemmelse med betingelseme for perceptuel overstimulation i fors0g med DL 
(jf. beskrivelsen af okklusionsmekanismen side 116). 

I fors0get pi at belyse ovenstaende problematik har jeg beregnet sand- 
synligheden for den konkrete kategoritilskrivning. Til dette formal har jeg 
opstillet en ’nul-hypotese’, Hq, der skal blotlaegge sandsynligheden for, at en 
given stimulus ikke identificeres Qf. beskrivelsen af Hq side 77). Som det 
fremgar af P-vaerdieme i figur 3.3.4, er de stimuli, der har fremkaldt den 
st0rste H0“praeference, samtidig de mindst signiflkante stimuli. 



Population: danske fors0gspersoners identifikationer 

Kategori: S 





tsttmulusi n (H0) < X, | S Z 



n^0) 1^1 X ' Isilgz 



^2 i,38' 


0,974 1 0,16d l -6,09 j • ‘itli ] 38' ■ 


■ 0,974 l o,16l| -6,09 






^o;9&»U;42 fiS«37. 


.IIM 0,949 l.d^ -4,26 _ 




fci„-®i|29.' i 


0,744 [o'Mi -1,683 fd^O® 33. 


; IsSI 0,846 |o,36i|'-2,31- 


\oMid 




!!33:i 0,333 lo;478 1 «0,697 ! o:2^' " T 23 ' 


159.'-I0390j,0,498j 0,18 


td,!!Hl 



8;.!vi.' ’ Pira 0,205 lo;4oli .-0,501. f-o^M lO'; • «i, 0,256 _-o,58 - |o^8iii 



Resultater fra forsog med dikotisk lytning: et S-T-D-kontinuum 




Ka^ori: T 

ri (H0) I 












^ Q-667B^1. 

':79l 0,795 Id^i 







Thomas O. Madsen 



Population: Finske 
Kategori: S 



fors0gsper$oners identifikationer 




4 



144 



Resultater fra fors0g med dikotisk lytning: et S-T-D-kontinuum 







-Ofaservationsvaer^ pragsentotion af fokijfelyd for H0/ V0: | 




Procent 



i PI Den aritmetiske middelvserdi 



Stand ardafvi gel sen „ 



„ Observationsv^rdLens afvigelse ^ fra den; , aritmetiske- 
middeivaerdi udtrykt ‘i standardafvigeisesei^eder " v. .1 
S| Sands yhlifihed for 
F<: 



Figur 3.3.4 




135 



Thomas O. Madsen 



3.4 Resultater fra fors0g med dikotisk lytning: 
et I-E-yE-A-kontinuum 

I det foregSende kapitel si vi, at perceptionen af dikotisk praesenterede stimuli 
fra et VOT-kontinuum afspejler en H0-praeference, hvilket kan tolkes som 
udtryk for hemisfaereasymmetri bide hos danske og finske fors0gspersoner. 
Hvis hypotesen om en lateraliseret sprogprocessor, der involverer 
neurologiske motorkommandoer, udelukkende vedr0rer artikulatorisk 
komplekse sproglyde, kan vi forvente, at perceptionen af isolerede vokallyde 
ikke afspejler en H0-praeference. Er de processer, der varetager analysen af 
vokallyde, generelle auditive processer, kan vi endvidere forvente, at en 
dikotisk praesentation ikke fremkalder nogen 0repraeference overhovedet. 

I det f0lgende er det min hensigt at praesentere resultater fra fors0g med 
dikotisk praesentation af et syntetisk produceret formantkontinuum. 
Resultateme stammer fra to fp-grupper bestiende af hhv. 38 danskere og 16 
finner, der alle bar identificeret 19 stimuli som enten 'A', 'E', T, 'JE eller 
’A’, ’E*, T. Hver stimulus bestod af en fokuslyd - vokallyden - og en 
distraktionslyd. 




1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 

Formant-kontlnuum 



Fp: 38 danskere 








10 11 12 13 14 15 1 

Formant-kontlnuum 




Resultater fra forsog med dikotisk lytning: el I-E-^-A-kontinuum 



Fp: 38 danskere 




Fp: 38 danskere 




t 2 3 4 5 8 7 8 9 10 11 1213 141516 171819 

Formant-kontinuum 



Figur 3,4,1 

Figur 3.4.1 illustrerer de danske fors0gspersoners identifikationer af de 19 
stimuli. Procentfordelingen bygger pi 722 praesentationer og identifikationer 
(38 • 19). Som det fremgir af histogrammet er der ingen generel tendens til 
H0-praeference. Deri mod lader det til, at dikotisk praesentation af vokallyde 
fremkalder en diffus fordeling af identifikationer - hvor praesentationen af 
nogle stimuli fremkalder en H0-praeference, foranlediger andre en V0- 
praeference. 
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Figur 3.4.2 

I modellen over de fmske fors0gspersoners identifikationer af samme VOX- 
kontinuum, prsesenteret dikotisk og binauralt, finder vi samme diffuse 
fordeling, som vi fandt hos danske fors0gspersoner, jf. figur 3.4.2. 

Figur 3.4.2 illustrerer 16 finners identifikationer af de 19 syntetiske vokal- 
lyde og er sSledes baseret pS 304 praesentationer og identifikationer (16 • 19). 
Ogs5 hos de fmske fors0gspersoner finder vi en diffus fordeling af 
identifikationer: tilsyneladende fremkalder dikotisk presentation af nogle 
vokallyde en H0-preference, mens andre udl0ser en V0-preference. 

Hvis vi udelukkende fokuserer pS forskellen mellem dikotisk presenterede 
stimuli og binauralt presenterede stimuli, er det muligt at isolere variationen 
i kategoritilskrivningen. S0jleme i figur 3.4.3 representerer den 
akkumulerede forskel (i procent) mellem identifikationer ved binaural 
presentation og ved dikotisk presentation med fokuslyden i H0, og den 
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akkumulerede forskel mellem identifikationer ved binaural praesentation og 
ved dikotisk praesentation med fokuslyden i V0. 
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Figur 3.4.3 

Ved at fremhaeve den akkumulerede forskel mellem identifikationer ved 
binaural praesentation og dikotisk praesentation, kan vi illustrere to vaesentlige 
forhold: 

1) For det f0rste afspejler fors0get med dikotisk praesentation af isolerede 
vokallyde hverken en generel H0-praeference eller V0-praeference. Der er 
simpelthen ikke grundlag for at haevde, at identifikationer ved binauralt 
praesenterede vokallyde i h0jere grad stemmer overens med dikotisk 
praesenterede fokuslyde i enten H0 eller V0. 

2) For det andet kan vi konkludere, at dikotisk praesentation af vokallyde 
fremkalder en diffus fordeling af identifikationer. Med fi undtagelser afviger 
de danske identifikationer ved dikotisk praesentation mellem 10 og 30% fra 




139 



Thomas O. Madsen 



identifikationer ved binaural praesentation. Hos de finske fors0gspersoner er 
variationen lidt st0rre, isaer ved stimulus 9 og 10. 

Arsagen til den relativ store forskel mellem dikotisk og binaural prsesentation 
af stimulus 9 og 10 hos de finske fors0gspersoner er sandsynligvis, at stimuli, 
der er svaere at identificere, lettere kan maskeres af en distraktionslyd, end 
stimuli, der generelt er lette at identificere. Vokallydene er generelt svaerere 
at identificere end konsonantlydene [s], [t] og [d] og er derfor ogsa lettere at 
maskere, hvilket 0ger sandsynligheden for variation, dvs. bade variation 
opstaet ved tilfaeldighed og betinget af hemisfaereasymmetri. Da stimulus 9 og 
10 indg^ i et akustisk kontinuum bestaende af ekvidifferente stimuli, er der 
intet, der taler for, at netop de stimuli skulle vaere genstand for et sasrligt 
identifikationsm0nster. Derimod adskiller stimulus 9 og 10 sig fra de 
resterende ved ikke at tilh0re nogen af de sproglige kategorier: hverken 
stimulus 9 eller 10 er statistisk signifikante ved Hq(P < 0,05) for nogen af 
kategorieme, jf. figur 3.4.4. Med andre ord kan variationen i identifikationen 
af stimulus 9 og 10 let vaere opstiet ved en tilfaeldighed og ikke ved 
hemisfaereasymmetri. 
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3.5 Resultater fra fors0g med dikotisk lytning: 

[la], [ma], [na], [fa] og [va] 

I de to foregSende kapitler si vi, at perceptionen af dikotisk praesenterede 
stimuli fra et VOT-kontinuum afspejler en H0-praeference, hvorimod stimuli 
fra et formantkontinuum ikke fremkalder nogen 0repraeference, dvs. hverken 
en H0- eller en V0-praeference. Jeg har valgt at tolke disse resultater som et 
udtryk for hemisfaereasymmetri hos bide de danske og de finske fors0gs- 
personer. 

For endvidere at underbygge hypotesen om specifikke lateraliserede sprog- 
processer, der varetager analysen af artikulatorisk komplekse sproglyde, har 
jeg udvidet unders0gelsen til ogsi at omfatte CV-stavelser bestaende af en 
lateral, nasaler og frikativer kombineret med et langt [a]. FormSlet med at 
praesentere disse stimuli er naturligvis at finde ud af, om lateraler, nasaler og 
frikativer resulterer i en dikotisk effekt, dvs. en H0- eller V0-praeference. 
Hvis analysen af likvider, frikativer og semivokaler belt eller delvis afhaenger 
af de lateraliserede processer, kan vi nemlig forvente af finde en H0- 
praeference i identifikationen af de dikotisk praesenterede CV-stavelser. 

Fors0get med dikotisk praesentation af [la], [ma], [na], [fa] og [va] blev kun 
udf0rt med 37 fors0gspersoner, der alle er danskere. Hver stimulus bestod af 
en fokuslyd, dn af CV-stavelseme, og en distraktionslyd. De 37 fors0gs- 
personer blev bedt om at identificere hver fokuslyd to gange, hvilket betyder, 
at det empiriske materiale bestir af 370 praesentationer og identifikationer (37 
•5-2). 



120 

100 

80 




20 



0 



Fp: 37 danskere 




|V0 

BH3 



[la] 



[ma] 



Ina] 



|fa] 



(va) 



Figur 3.5.1 





Resultater fra forsog med dikotisk lytning: [la], [ma], [na], [fa] og [va] 



Figur 3.5.1 illustrerer de 37 danske fors0gspersoners identifikationer af de 5 
CV-stavelser. 

Som det fremgar af figuren har fors0gspersoneme i et vist omfang vaeret i 
stand til at identificere stimuli som tilh0rende en af de fern kategorier. De har 
dog haft relativt lettere ved identificere [la], [ma] og [fa] end [na] og [va]. 

Det fremgar desuden, at fors0gspersoneme oftere har kunnet identificere CV- 
stavelseme, nar de er blevet praesenteret som fokuslyd for H0 end for V0. I 
et enkelt tilfaelde, nemlig ved praesentationen af [fa], har fors0gs-personerne 
identificeret stavelsen lige ofte i H0 og V0. Generelt kan vi dog konkludere, 
at ogsa ved praesentation af [la], [ma], [na], [fa] og [va] afsl0rer fors0g med 
DL en om end beskeden H0-praeference. 

Skdan som jeg tidligere opstillede hypotesen om en lateraliseret sprog- 
processor (se side 119f), var forudsigelsen, at en dikotisk praesentation af 
lateraler, nasaler og frikativer ville resultere i en dikotisk effekt, men en 
mindre H0-praeference end ved dikotisk praesentation af klusileme [s], [t] og 
[d]. Fk grund af forskelle mellem de to fors0gsopstillinger har jeg desvaerre 
ikke mulighed for at foretage en direkte kvantitativ sammenligning af den 
dikotiske effekt ved praesentationen af de to typer stimuli. Derimod er der 
mulighed for at sammenligne forskellen mellem identifikationer ved 
praesentation for hhv. H0 og V0. I en beregning af den kumulerede forskel (i 
procent) mellem korrekte identifikationer ved praesentation for H0 og V0 
viser det sig, at hver stimulus fra det akustiske VOT-kontinuum i gennemsnit 
er blevet korrekt identificeret 7,8% oftere ved praesentation for H0 end for 
V0‘. Omvendt udg0r den kumulerede forskel mellem korrekte 
identifikationer af [la], [ma], [na], [fa] og [va] ved praesentation for H0 og V0 
kun 3,6%, hvilket vil sige, at disse stimuli i gennemsnit er blevet korrekt 
identificeret 3,6% oftere ved praesentation for H0 end for V0. Med andre 
ord kan jeg alts^ konkludere, at dette fors0g med dikotisk praesentation af [la], 
[ma], [na], [fa] og [va] afsl0rer en general H0-praeference, men en mindre 
H0-praeference end i et tilsvarende fors0g med et akustisk VOT-kontinuum. 



* For overhovedet at kunne foretage denne sammenligning har jeg vaeret n0dt til at definere 
den "korrekte" kategoritilskrivning for hver stimulus, hvilket jeg har gjort pa baggrund af den 
hpjeste procentvise kategoritilsl^vning i identifikationsfors0gene. Beregningen af den 
kumulerede forskel er i0vrigt udelukkende foretaget pa baggrund af data fra gruppen af danske 
fors0gspersoner. 
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Populatio n; danske forsoppersoners identifikationer 
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Generelt resulterer fors0g med dikotisk praesentation af lateraler, nasaler og 
frikativer i en H0-praeference - dog en mindre H0-praeference end ved 
praesentation af klusiler og en st0rre H0-praeference end ved praesentation af 
vokaler. Resultatet fra dette fors0g afviger ikke fra denne tendens. 

Hidtil har jeg forklaret den kategoriske og dikotiske effekt ved praesentation 
af klusiler og vokaler ud fra dikotomien artikulatorisk kontinuitet/dis- 
kontinuitet. Sp0rgsmSlet ml nu vaere, hvordan [1], [m], [n], [f] og [v] relateres 
til disse termer, si de stadig adskiller sig fra bide vokaler og klusiler. 
Traditionelle artikulatoriske beskrivelser, der tager udgangspunkt i 
mide/ibningsgrad, angiver ingen tilstraekkelige artikulatoriske karakteristika 
for ovenstlende perceptuelle kategori : pi den ene side kategoriseres frikativer 
og lukkelyde som obstruenter; pi den anden side kategoriseres nasaler og 
lateral(-er) som sonoranter (jf. f.eks. Heger 1992). Derimod kan den 
perceptuelle kategori beskrives som en medierende kategori, der besidder 
sivel vokalagtige som konsonantagtige (artikulatoriske) egenskaber: [1], [m], 
[n], [f] og [v] artikuleres alle med en vis hindring for udindingsluften langs 
mundkanalens midterlinje, hvilket er et track de har tilfaelles med klusileme; 
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Resultater fra fors0g med dikotisk lytning; [la), [ma], [na], [fa] og [va] 



omvendt er de ikke karakteriseret ved abrupt lukke eller abning under selve 
artikulationen, hvilket er et traek de bar tilfaelles med kontekstfrie vokaler. 
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4 Konklusion 

Gennem de sidste 45 ar har en lang raekke undersdgelser med kategorisk 
perception (KP) vist, at visse sproglyde perciperes som diskrete st0rrelser og 
derved fremkalder en sakaldt phoneme boundary effect'. Andre sproglyde 
perciperes mere kontinuerligt og synes ikke i samme grad at fremkalde 
skarpe kategorigraenser. Resultateme af unders0gelseme viser, at lukkelyde 
fremkalder den kraftigste kategoriske effekt, nasaler, lateraler og frikativer 
en mindre kategorisk effekt, og at vokaler perciperes kontinuerligt. 

Unders0gelser fra et belt andet paradigme, nemlig dikotisk lytning, har 
ligeledes gennem de sidste 45 ^ vist, at dikotisk praesentation af visse 
sproglyde kan fremkalde h0jre0re-prae fere nee. Denne H0-praeference tolkes 
almindeligvis som resultat af en hemisfaereasymmetri. Det er dog ikke alle 
sproglyde, som kan fremkalde en H0-prae fere nee. Resultateme af 
unders0gelseme viser, at lukkelyde fremkalder den st0rste H0-praeference, 
likvider, frikativer og semivokaler en mindre H0-praeference og at vokaler 
ikke fremkalder en 0reprae fere nee. 

I begge forskningsparadigmer arbejdes der ud fra en hypotese om, at 
perceptionen af sprog involverer et saerligt sprogmodul, en sakaldt sprog- 
processor, der varetager analysen af artikulatorisk komplekse sproglyde. I 
den ene forskningstradition (KP) underbygges hypotesen af fors0g, der viser, 
at klusiler perciperes som diskrete st0rrelser og vokaler mere kontinuerligt. I 
den anden forskningstradition anses hypotesen for at vaere den eneste plausible 
forklaring pa, at fors0g med DL afsl0rer en hemisfaereasymmetri ved 
praesentation af klusiler, men ikke ved vokallyde. I begge forsknings- 
paradigmer har man dog hidtil kun gjort sig teoretiske overvejelser om en 
eventuel sammenhaeng mellem den kategoriske og den dikotiske effekt. 

Med naervaerende unders0gelse har jeg fors0gt at kaste lys pa ovenstSende 
problemstilling. Indledningsvis producerede jeg et VOT-kontinuum og et 
formantkontinuum. Disse kontinua skulle udg0re hhv. konsonant- og vokal- 
stimuli i to forskellige fors0g, nemlig et med KP og et andet med DL. 

I fors0get med KP afsl0rede det artikulatorisk diskontinuerlige konsonant- 
kontinuum en h0j grad af kategorisk effekt: i identifikationsfors0get inddelte 
fors0gspersoneme det akustiske kontinuum i skarpt afgraensede kategorier; i 
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diskriminationsfors0get kunne fors0gspersoneme ikke skelne mellem stimuli, 
som de havde tilskrevet samme kategori, hvorimod de meget lettere kunne 
skelne mellem stimuli fra forskellige kategorier. Da samme akustiske 
kontinuum blev praesenteret i fors0get med DL, viste fors0gspersoneme en 
markant bedre evne til at identificere stimuli praesenteret for H0 end for V0, 
hvilket kan tolkes som et resultat af hemisfaereasymmetri. 

Omvendt fremkaldte det syntetiske vokalkontinuum slet ingen kategorisk 
effekt: Fors0gspersoneme var i stand til relativt konsekvent at tilskrive 
stimuli de samme kategorier, men i diskriminations0velsen gjorde det ingen 
forskel for fors0gspersoneme, om de skulle diskriminere stimuli fra samme 
eller forskellige kategorier - resultatet var lige ringe. Ligeledes fandt jeg 
heller ikke nogen generel dikotisk effekt, da jeg praesenterede det samme 
vokal-kontinuum i fors0get med DL: Fors0gspersoneme var hverken generelt 
bedre til at identificere stimuli praesenteret for H0 end V0 eller omvendt. 



Da flere fors0g har vist en tendens til en mindre kategorisk og dikotisk effekt 
ved praesentation af isaer likvider og frikativer, besluttede jeg ogsS at inddrage 
CV-stavelseme [la], [ma], [na], [fa] og [va]. Disse stimuli blev praesenteret i 
fors0get med DL og viste - som forventet - en H0-prae fere nee, dog mindre 
end den jeg fandt ved praesentation af det akustiske VOT-kontinuum. 

PS baggrund af naervaerende unders0gelse kan jeg konkludere, at der 
eksisterer en klar sammenhaeng mellem graden af kategorisk effekt og 
effekten i fors0g med DL, dvs. hemisfaereasymmetri. 

For endvidere at fastsla om egenskabeme 'kontinuitet' og 'diskontinuitet* 
vedr0rer sproglydes akustiske struktur eller om de snarere knytter sig til den 
sprogspecifikke artikulatoriske struktur, valgte jeg ogsa at inddrage en gruppe 
finske fors0gspersoner i unders0gelsen. Formalet med den komparative 
metode var at finde ud af, om fors0gspersoner, der taler forskellige 
modersmal, kategori serer de samme akustiske kontinua ens eller forskelligt. 
Hvis den kategoriske effekt skyldes sproglydenes akustiske struktur, skulle 
man forvente, at den determinerer de fonetiske kategorier — dvs. 
identifikationS" og diskriminationsgraenseme - uafhaengigt af den lingvistiske 
organisering af fors0gspersonens modersmal. Hvis den kategoriske effekt 
derimod skyldes sprogspecifikke artikulatoriske strukturer, ma den forventes 
at forkomme ved alle lingvistiske kategorigraenser - og kun der. 
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Sp0rgsmalet om hvorvidt den kategoriske effekt sky Ides psykoakustiske 
faktorer eller sprogspecifikke fonetiske kategoriseringer kan ikke besvares 
belt ^ntydigt pa baggrund af fors0gsresultaterne. Det fremgir dog meget 
tydeligt, at den lingvistiske organisering af fors0gspersonernes modersmal 
bar stor indflydelse pk identifikationen og diskriminationen af sproglyde fra 
akustiske kontinua; de to grupper af fors0gspersoner strukturerer de akustiske 
kontinua forskelligt, men belt i overensstemmelse med de fonetiske kontraster 
pa de respektive sprog. Omvendt viser resultater fra de danske 
fors0gspersoner, at sprogspecifikke artikulatoriske strukturer ikke kan 
forklare alle faenomener; til trods for at stemtbedsgraensen (0 ms VOX) ikke 
indgar i den danske strukturering af udtrykssubstansen, afsl0rer fors0g med 
danske fors0gspersoner en 0get diskrimination af stimuli fra samme kategori, 
men fra bver sin side af stemtbedsgraensen. Meget tyder altsa pk, at egen- 
skabeme 'kontinuitet' og 'diskontinuitet' bedst kan appliceres pk de sprog- 
specifikke artikulatoriske strukturer, men at sprogbrugere ogsa anvender 
anden information end de artikulatoriske kommandoer i identifikationen af 
sproglyde - uanset om de er karakteriseret ved artikulatorisk kontinuitet eller 
diskontinuitet. 
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Bilag A: Akustiske analyser af syntetisk vokalkontinuum. 
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perception’ and ‘dichotic listening’. 



In the categorical perception paradigm, 
listeners’ categorization of speech sounds is 
compared with their ability to discriminate 
speech-like stimuli forming a physical 
continuum (such as the range between a 
t-sound and a d-sound). 



In the dichotic listening paradigm, 
differences in listeners’ identification of 
speech stimuli presented to either left or 
right ear are interpreted as the result of 
hemispheric lateralization. 
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